输入法的那些事.doc_第1页
输入法的那些事.doc_第2页
输入法的那些事.doc_第3页
输入法的那些事.doc_第4页
输入法的那些事.doc_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

输入法行业的那些事版本修订日期修订内容修订人V0.12010-12-24初始化Samuel Song2011-1-7添加国内行情Samuel Song2011-2-16添加点讯Samuel Song2011-4-13增加搜狗和S91行业发展21.1当前行情21.2盈利模式21.2.1专利授权21.2.2用户流量31.3技术31.3.1字母输入31.3.2中文输入31.3.3平台特性32国内公司42.1百度42.2搜狐42.3腾讯42.4Google52.5纯输入法公司52.5.1金拇指Komoxo52.5.2国笔Guobi52.5.3点讯53国际巨头6回顾行业的历史,记录行业的现在,预测行业发展的未来。1 行业发展1.1 当前行情2011-4-13:搜狗输入法收购了网道S9,组建了30多人的feature phone平台团队,发力feature phone,相当猛。2011-2-16:国笔的问果有点意思,在输入法中加入了人工智能,根据用户输入提供信息增值服务,这个服务他们做没有优势,我们做有优势。2011-1-7根据最近了解到的feature phone市场的情况看,国内主要使用国笔输入法,海外是金拇指。国笔只支持中、英文,但是比较便宜,所以出国内的货一般使用国笔。金拇指做的比较好,提供全语言支持,但是比较贵。目前韩文输入法在市场上比较紧俏,金拇指和国笔都在搞,但是不够稳定。国内手机一般提供中英文输入法,包括:拼音,笔画,智能拼音,数字,英文大写,英文小写,英文智能大写,英文智能小写等8中输入法模式。2006年:T9最贵,2块,Zi差点,1.5,CStar最便宜,1.2搞定。1.2 盈利模式传统的盈利模式是专利授权,但是目前(2010年)在国内,各大互联网巨头纷纷进入,打破了传统的模式。1.2.1 专利授权手机输入法主要是一个专利授权市场。Tegic公司拥有重要的第二代缩减键盘(Reduced Keypad)输入法专利,如Tegic著名的5,818,437号等美国专利。在手机市场刚刚兴起的时候,Nokia与Tegic签署了为期5年的协议,据传,当时每年的授权费不到$8M。2004年,Nokia和Tegic的合约到期后要续约,而此时,AOL已并购Tegic,拥有强大的律师团队,尽管Nokia一万个不愿意,但最后还是只能与Tegic签订城下之盟,屈辱地按手机数量付费,支付给Tegic的授权费一部上涨到每年约$30M。Samsung每年支付给Tegic的授权费约为$15M。近10年来,Tegic、Zi之间因为专利而官司不断,有兴趣的读者可搜索“tegic zi lawsuit”获得更多信息。可以说,没有核心专利的公司,国际一线品牌不会、也不敢采用。除了专利,手机输入法供应商还必须是全语言技术供应商。手机在不同国家之间的差异主要在语言上,手机品牌厂家或者手机设计公司要随时要面向不同市场的需求。可能昨天是越南,今天越南卖不动了,明天就需要转到泰国-输入法与语言切换必须立即完成才能赶得上市场需求。一般而言,40种语言是一个检验的门槛,没有40种语言的引擎,就不是全语言技术的厂家。1.2.2 用户流量提出免费使用,甚至花钱装机。目前主要是互联网巨头。用用户流量来换取广告价值。1.3 技术1.3.1 统计BDF文件:Glyph Bitmap Distribution Format,Adobe出的点阵字体文件格式。字库: 102KB:2万多(MTK减到8000多,其中6000多常用字,其他生僻字)笔画: 145KB:同字库词库: 781KB:8万多,2字词5万多,3字词2万多(MTK减到2万多)英文: 221KB:2万多,这个是从美国公布的常用英文及其频率得到的数据。(MTK减到6000多)/ 进行一次拼音find_choose_and_print(cd, fout, women, FINDTYPE_PY, 0);/ 拼音查询,并用第一个首笔画过滤find_choose_and_print(cd, fout, women, FINDTYPE_PY, 1);/ 拼音查询,并用第二个首笔画过滤find_choose_and_print(cd, fout, women, FINDTYPE_PY, 2);这种womne属于精确输入,适用于26键的键盘或者虚拟键盘,后面的1,2是按照笔画过滤,第一笔是横,第二笔是竖。/ 拼音T9查询find_choose_and_print(cd, fout, 966, FINDTYPE_PY, 0);后面跟的是index,在一个按键对应多个候选list的时候,例如:2键对应abc,有可能是a,bo,ci等等,所有index是第几个选项。在没有index的情况呢?ipt_cleanall会清除上次getlist或者find的结果,在我的智能拼音中,先getlist,把结果返回给上层,然后再进入find,此时getlist的结果还在,因此我直接通过ipt_listcount和ipt_getliststr获得list结果,从而得到find需要的index,否则我需要在第一次getlist的时候保存结果,这样做可以节省部分内存。那么在FINDTYPE_PY情况下,在进行find的时候,输入T9码和输入26键值,会有区别吗?有区别,T9的后面option是按照index过滤,而26键是按照笔画过滤。这里就遇到了问题,在MTK中,目前无法分辨是T9输入,还是26键输入,或者是第一个键是按的T9,然后又用选项键还移动光标。按键:mmi_imc_key_smart_phonetic_get_composition,即T9输入下。一定要区分开是26键还是9键,即是精确查询还是模糊查询:为啥?我好像找到了这个方法,在MTK上。先触摸屏输入中文,再按键,看有啥后果,直接进入了T9模式。所有2中模式是不会共存的。第1行是ipt_getlist得到的。1.3.2 字符编码1.3.3 字母输入在字母文字语言的手机输入法专利方面,据了解,微软持有第三代手机键盘输入的核心专利。简单地说,Tegic和Zi的第二代专利是以字典词表为中心的,而第三代专利是以基于统计的二元、三元上下文智能关联模型为中心的。1.3.4 中文输入传统上,Tegic和Zi的中文输入法都是单字和单字加联想方式,与PC上的智能词组输入法想去甚远。在2005年6月,Komoxo推出了全新的词组输入方式,创造性地用一种流畅的认知心理交互过程设计,解决了小键盘上词组连续输入和拼音选音等问题。此后,国笔、点讯、A4、S9等都迅速跟进,实现了类似的拼音词组输入逻辑。包括搜狐手机拼音输入法,也都是Komoxo当初的套路。经过接近4年的推广和普及,手机词组输入方式现在成了部分用户挑选手机的一个关键点。1.3.5 平台特性Feature Phone的典型配置是128Mb/32Mb,即16MB/4MB的ROM/RAM,现在流行的超低端手机只有64Mb/32Mb,这么小的空间,留给输入法ROM/RAM通常要在164KB/8KB以下,所以,输入法想在Feature Phone玩,还得下一番功夫。2011-1-7:了解到金拇指的输入法ROM大约450K,动态RAM大约30K。2010-12-24:现有的Zi输入法大小如下:RO:19239804 18953816 = 280KRW:9680055 9672585 = 7KTotal:19300539 19014438 = 280K2 国内公司国内做输入法的公司分为2个部分,一部分是纯做输入法发的公司,随着近几年国产手机行业的崛起,这些输入法公司逐步做大做强。另外一部分是传统的互联网公司,看到输入法的粘性,开始涉足这个领域,但主要是做中英文输入法,目的是获取流量和用户使用数据。以搜狐,腾讯,Google和百度为代表。2.1 百度2009年10月,百度收购了上海点讯网络技术有限公司。CTO徐新意带领团队加入百度。2010年10月14日,发布PC输入法1.0Beta版本。2010年12月3日,发布1.0.1Beta版本,安装包大小为14.1M。2.2 搜狐搜狐于2006年6月推出桌面版的搜狗输入法。2008年10月又推出了手机输入法,主要集中在Symbian和Windows Mobile手机上。2.3 腾讯2007年9月,腾讯推出QQ拼音输入法。11MB大小。2009年收购中天A4,进入手机输入法市场。2010年6月3日,推出Android手机输入法。2.4 Google2007年4月,Google发布输入法。2.5 纯输入法公司除了下面2个比较大的公司,还有汉翔Cootek,中天A4,点讯Dayhand和网道S9。从客户分布看,Komoxo的主要客户为国内品牌厂家,除了输入法,高性能矢量文字缩放引擎以及复杂文本语言编辑器等。Cootek、A4、Dayhand主要在Windows Mobile等智能手机的中文市场。而Guobi和S9的主要市场为深圳和上海的灰色山寨市场。2.5.1 金拇指Komoxo已成成为继Tegic和Zi之后,全球第三大的输入法提供商,是国内第一家全语言拥有全语言技术的提供商。该公司一直极其低调,但MTK、展讯、大唐联芯TD-SCDMA等这些业内公司都同时认可Komoxo的产品,预先整合Komoxo产品,这也是其他国内厂家没有达到的。目前国内大的DH的海外市场基本都使用金拇指的产品,费用比国笔要高,因此国内市场很多DH还是选择使用国笔等输入法。相当低调,官方网站:/index.html很难找到宣传信息,估计属于那种闷头赚大钱的那种公司,下面是在我爱研发网看到的信息:北京金拇指科技有限公司是一家专门定位于手机全球语言解决方案的企业。我们提供的产品包括:1)多国语言文字输入法引擎,包括阿拉伯语、孟加拉语、印地语等35种的输入引擎,且已经被展讯、MTK、大唐等官方预先集成;2)矢量文字无级缩放引擎:支持TrueType和OpenType格式的矢量字库,能在展讯6600i/6600R以及MTK6225、6226等ARM7低端芯片上流畅运行;3)全语言编辑与排版引擎:支持Unicode5.0所定义的所有语言的排版规则,包括双向、整形、排版禁则等等。2.5.2 国笔Guobi目前主要做国内市场,盈利模式主要是收取使用费,对于大客户按照年费的方式收取,不计出货量,按照每年多少钱的方式一次交齐。小客户可以按照出货量来收取费用。80K ROM(不算数据,只算内核和MMI)30K RAM(内核使用),如果加自造词,再加5K。2.5.3 点讯2002年Peter复旦毕业了就开始搞梅花输入法,后来和一家法国公司合作,他任CTO和技术总监。2007年和屠一新一起开创点讯公司。3 国际巨头Nuance是当之无愧的老大。该公司于2007年6月以2.65亿美金从AOL手中收购了手机输入法老大Tegic T9公司,又于2009年2月,以3600万美金收购输入法老二加拿大的Zi公司。Nuance在2009年市值达到26亿美金,年营销额9亿美金(百度市值300亿美金,营收45亿人民币)。资料搜狗拼音输入法是2006年6月由搜狐(SOHU)公司推出的一款Windows平台下的汉字拼音输入法。搜狗拼音输入法是基于搜索引擎技术的、特别适合网民使用的、新一代的输入法产品,用户可以通过互联网备份自己的个性化词库和配置信息。搜狗拼音输入法为中国国内现今主流汉字拼音输入法之一,奉行永久免费的原则。马占凯-Sogou输入法之父 2005年,本科刚毕业、在太原一家国企做机械设计的马占凯找到了一种省力的方法:写东西时,如果输入法不能直接打出所需词语,他不愿意去输入法的词表 里一页一页寻找想敲的字,而是在搜索框里输入相应的拼音(比如:zhoujielun),获得搜索引擎相应的提示(“您要找的是不是:周杰伦”),由此复 制粘贴。 这名没有任何计算机背景,但每天可能使用百余次搜索的年轻人,曾经自己猜测出一套解释:搜索引擎有一个人工整理的巨大词 库。但稍微刨根问底之后,他发现,搜索引擎充分利用了用户输入的关键词,每当某个关键词的搜索量达到一定的数目,比如几百万次,那么这个关键词就自动被收 入搜索引擎的词库。换言之,用搜索引擎来生成一个常用词的巨大词库,花费极小。 这让马占凯隐隐觉得,让搜索引擎来做输入法大有可为。 如果当时他认识任何输入法业内人士,他的想法会被无情打击:谁还会在2005年进入输入法行业呢?早在1980、1990年代,微软就相继收购了智能 ABC和微软拼音,捆绑在Windows操作系统之中。此后还有一些来自民间程序师的作品,到2005年,这几乎已经成为一个寡头垄断的领域:智能 ABC、紫光拼音、拼音加加和微软拼音占据了输入法市场的90%。 理论上,所有这些产品都具备充分的改进空间。它们都是由人工整理词库,成本高且效果不好,很多词不能及时被收入词库。占市场第一位的紫光拼音,甚至2003年到2006年初没有推出一个升级版本。 但商业的力量阻止了改善的动力。输入法是一个叫好不叫座的产品。尽管中国的用户不可避免使用到它,但是却无法靠它取得收入。于是,输入法领域的状态是:不断有人看到市场需求,不断有人做出解决了某些问题的新产品,却没有人能坚持长期而频繁的升级和维护过程。 从某种程度上说,马占凯改变了这一切。如今,他已是搜狗输入法的产品经理,他创意和设计的输入法,为搜狐提供了一个接触广泛用户的新通道:8月底第11 版输入法推出,新产品将和用户账户绑定,通过同一账户可以在不同电脑上使用自己的个性化输入法。于是,输入法和博客一起,成为整个搜狐产品的入口,将为带 动其新闻、社区等产品产生积极效用。 更重要的是,自QQ旋风般占据四亿网民的桌面开始,客户端软件就展示了其巨大的想象空间。而输入法是客户端中粘性大、使用频率高的软件之一,比如,紫光拼音2005年的下载量就仅次于腾讯的QQ,约为2到3亿。 鸡肋 在中国科技业商业化程度不高时,输入法曾是创新最密集的领域除了拼音、五笔,还有自然码等数十种相关产品。 早在1980年代末,哈工大的一位博士生王晓龙就研发出了一款支持整句输入的输入法系统,后来为微软所收购,成为微软拼音。早期,输入法领域还有“中文 之星”所提供的新拼音输入法,以及后来同样被微软收购的智能ABC。“中文之星”留给很多人的记忆已经淡薄,然而这款让计算机识别中文的产品,其开发者包 括新浪奠基人王志东,以及后来的拼音加加的创始人廖恒毅。 在这些基础之上,1996年,名噪一时的黑马输入法推出。其开发者王励 在联想汉卡待了三年多,在中文处理上积累了丰富经验。那时,这个技术爱好者因为联想要安排其去做管理职位而离开联想,加入黑马飞腾科技有限公司,主导起校 对技术的开发,并抽时间开发出了“黑马神拼”。 直到前不久搜狗和谷歌的争端激烈之时,中国最著名的博客之一王小峰还在其博客上称赞使用多年的黑马神拼质量之高,引发了外界对黑马的关注。 王励把黑马输入法归为是有别于五笔的字输入、智能ABC及搜狗输入法等的词输入的第三代输入法,在整句输入上准确率很高。黑马拼音的句库来自报纸、文学 作品等成文的文字内容,并有自动学习功能,既杜绝了错词的出现,又具有相当高的智能化水平。不过,黑马输入法也有一个致命的弱点:体积大,有400多兆, 不利于传播。 但在当时互联网连接不畅情况下,这倒不成为问题。依靠光盘销售,黑马神拼给黑马公司带来了意料之外的收入。直到今天,黑马采取的仍然是这种销售模式。 不过,2001年,考虑到竞争对手是强大的微软、输入法又无法提供企业所需要的资金,王励放弃在输入法上的继续更新,把精力集中到了黑马的文字校对业务,只留下黑马神拼2001版和一些输入法底层技术作为销售和合作之用。 而因为找不到合适输入法使用、干脆自己开发了拼音加加的廖恒毅,也一度因为每月上百元的注册费无法支撑,而停止了开发和更新。 当然,这些人也并非没有尝试过寻找商业化途径让输入法增值,不过仅仅停留在个人站长式的经营方式上。比如,廖恒毅曾将拼音加加的首页放置了一个百度的搜 索框,进而和百度合作分成。后来,廖恒毅干脆把首页设成了一个类似那样的导航页面,这样一来,他便能每月从中获得 10万元左右的收入,这才结束了停止更新的日子。 “融资上市是一个机会,不过我只是一个资深技术人员,过程太复杂,无法把握。”王励表示。 于是,这些输入法的创始人们,几乎都只把输入法作为一个“副业”,自己却不约而同的投入企业软件这个“离钱更近”的领域。 这就使得2005年中,作为一个互联网行业的门外汉,马占凯有机会凭借一个资深互联网用户的体会、拿着对输入法产品的重新定义敲开了搜狐的大门:体积小,容易在互联网上传播;能敲打出热门词语;有一个专门的团队运作,更新快。 寻找伯乐 那时是马占凯工作一周年,他终于忍受不了国有企业的沉闷与缓慢而辞职,怀揣着从亲友那里借来的钱,只身来到北京,起初的目的是为了学些技能,再找工作。 在北京,扑面而来的,是互联网的炽热:一时间,李开复离开微软来到谷歌中国、雅虎与阿里巴巴签订收购协议、百度即将上市前景看好!这让输入法的创意在马的脑海中重新升起。 百度上市前半个小时,马占凯趴在电脑前,按照网上的客服邮箱给百度写电子邮件,简要阐释了输入法的创意:把百度搜索默认的拼音提示都纳入字库中,再加上在线同步升级数据库的功能,互联网上的热词马上就能出现在输入法的词库中。 发出去之后,马坐立不安地等待回复,在脑子里又搜索了一遍,生怕遗漏任何会引起别人的注意的建议。第二天中午,马又补充了一封信,加上在输入法中集成百 度搜索和桌面搜索功能的提议。然而,几天下来,不断刷新邮箱的他只收到百度的一封例行回复,无任何进一步商谈或合作意向。 马不甘心,在又发去几封邮件仍石沉大海之后,决定转投搜狐。这一次,马等来了迅速而且热情洋溢的回复,搜狐的人表示对此很有兴趣,约马占凯三天之后到办公室一谈。 这三天的等待时间,马占凯并没有浪费。他全神贯注的待在电脑前,不断使用搜索引擎、阅读相关理论,想为来之不易的面试做足准备。于是,三天之后,在去搜 狐前,他把这三天的成果事先发了过去30 页的文档,其中包括上万字的搜索笔记、200个灵感点和100个小创意。 这种对搜索引擎的熟悉和产品思维为马占凯顺利赢得了第二份工作,成为搜狐的产品经理。 马决定继续去游说搜狐公司副总裁王建军。为了使自己更具有说服力,他统计了QQ和输入法在各大下载网站上的下载量,并逐个分析了输入法这个领域的竞争对手,把这些做成两份 PPT。其显示: QQ有约5亿次下载,而输入法的下载量是2到3亿次。 第二次看完PPT之后,王明确:一定要做。 事实上,输入法的开发,与搜狐的战略转移有很大关系。 1998年,张朝阳仿效雅虎的网页目录模式建立搜狐,进入大而全的门户运作。然而,2003年左右,这种内容主导的思路产生了动摇。让搜狐有切肤之痛的关键在于:在诸多重要产品上,如搜索、即时通讯等,搜狐都因为技术不如对手而落后甚远。 不久之后,搜狐建立研发中心,主要是在搜索领域加强技术研发,即研制搜狗搜索引擎。一则从长远来看,搜索是互联网发展的一个重要方向。二则搜索本身技术 含量较高,研发出来的技术也可以辐射到搜狐的其他产品领域。早期,研发中心甚为保密,并未和搜狐在同一办公楼,也没有门牌标识。由于与网易研发中心同处一 楼,张朝阳每次去时都要拉低帽沿,生怕被对方员工认出。 即便采取此般暗渡陈仓之道,挑战仍然显而易见:百度的技术已经积累4年之久,搜狗能依靠什么突破口迎头赶上? 正在搜狐高管们为这件事情头疼的时候,输入法的创意摆在了眼前。“输入法的开发,是搜狗的搜索技术发展过程中结出的一个果实,同时也可以提高搜狗的品牌形象。”搜狐技术副总裁王小川告诉环球企业家。 王小川正是统筹输入法开发的技术小组的负责人。在收购紫光拼音不成的情况下,200

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论