google开源项目软件,用以提取图片上文字的工具包。
一个可以对图像进行查看,编辑,处理,
和格式转换的开源软件工具包。
确切地说,应该叫GNU cgicc,
它是CGI应用的一个C++类库。
包括:
JNI的体验、JNA的体验,
Linux+tomcat+netBeans实现ocr接口服务器。
开放源码是一种协作。更具体地说,它是软件项目上的公共协作。google和IBM 在开放源码方面作出了巨大贡献。根据开放源码促进会(Open Source Initiative,OSI)的定义,可将开放源码定义为:"开放源码通过支持源代码的独立同业互查(independent peer review)和快速发展演变提高了软件的可靠性和质量。要通过 OSI 认证,软件必须在获得许可证的情况下发布,该许可证可保证免费读取、重新发布、修改和使用该软件的权利。"
其最大的好处是:免费的,代码是开放的。
开放源码软件主要被散布在全世界的编程者队伍所开发,但是同时一些大学,政府机构承包商,协会和商业公司也开发它。
开放源码软件在历史上曾经与UNIX,Internet联系的非常紧密。在这些系统中许多不同的硬件需要支持,而且源码分发是实现交叉平台可移植性的唯一实际可行的办法。在DOS,Windows,Macintosh平台上仅仅有很少的用户有可用的编译器,开放源码软件更加不普遍。对开放源码开发模式的更详细的讨论请看Eric Raymond写的“The Cathedral and the Bazaar”。
目前,已经有好几百种成熟的open-source产品被广泛使用。这里仅仅罗列出大型的,比较常见的:
(1)BIND: Berkeley Internet Name Daemon; 为几乎所有的Internet域名解析服务器使用,其行为如同一个分散全球的分布式数据库;由ISC(Internet Software Consortium)维护。
(2)BSD SendMail: 邮件传输代理的最高标准。没有任何一家商业竞争者能和它匹敌,绝对安全、健壮;负责处理Internet上超过75%的邮件传输任务,包括象AOL这样的巨型站点---每天有数百万的消息。由SendMail公司基于BSD许可协议维护。
(3)INN:InterNet新闻服务器,操纵Internet上的决大多数Usenet新闻还包括许多企业网。被ISC(BSD)所维护(BSD许可协议)。
(3)Apache: 超过半数的web服务器的动力(远远超出Microsoft和Netscape加起来的数量),早在1998年用于超过百万的web服务器。由Apache组织开发(类BSD许可证维护)。
(4)WU-FTPD: 在Internet网上最流行的FTP服务器,几乎使用于所有的FTP站点。最初是由Bryan O'Connor在Washington大学Louis大街开发的,现在被Academ Consulting Services和许多自愿者维护(BSD许可)。
更多有关open source 的介绍信息请参加adding introducing the open source。
当然,还有其他许多应用于特定场景,特定项目中的open source project。
这次进入公司中实习,刚到公司就一连接触了三个open source tools,tesseract-ocr、imagemagick和cgicc。现在实习也20多天了,烦恼过,痛苦过,但是也学习了好些东西,需要将学习的东西做一些整理,发表出来,与大家一起分享。