AI技术专利研究系列:NetBase,自然语言处理领域的资深玩家
TiPLab砸光司马缸
2018-05-16

AI领域的专利在维权中通常会遭受专利适格性或创造性的挑战,在专利权人抵御了确权阶段的围攻之后,又常面临虽专利权有效却不能维权的尴尬,其中相当一部分原因是,在专利的撰写阶段未能在说明书中清楚定义功能术语或充分解释技术特征,导致法院无法清晰地划定权利要求的保护范围而维权失败。

对企业而言,及时获取客户满意度(Consumer Satisfaction)对调整运营策略是相当重要的。在追踪和调查客户满意度的手段中,传统的做法例如电话访谈,通过街访或电子邮件等形式征集调查问卷等形式。

随着互联网信息和移动通信技术的发展,更多的消费者已经习惯使用在线工具(比如FaceBook,Twitter,Yelp,TripAdvisor,微博,微信、大众点评等社交平台)来表达他们对各种产品和服务的看法。因而,利用文本分析工具追踪客户满意度的技术应运而生,比如社交媒体分析技术,该类技术的核心是自然语言处理(NLP)。

自然语言处理领域的专家:NetBase

本期我们讲一家利用自然语言处理技术帮助企业客户实时发布、指导、分析、跟踪企业/产品信息的公司:NetBase,这是一家位于美国加州Santa Clara的自然语言处理技术开发商。该公司于2004年由Ariba(现为SAP Ariba)公司的两名工程师Jonathan Spier和Michael Osofsky创立,早期名为Accelovation,于2008年更名为现在的NetBase。

NetBase利用社交分析技术,协助市场研究人员及品牌经理分析比较消费者的爱好,了解产品在网络上的品牌价值,并发掘消费者对产品喜好背后真正的原因,进而帮助他们的客户在数字营销、公共关系、品牌管理、客户服务、产品研发等方面获得提升。

NetBase最近的一轮(E轮)融资发生在2015年初,由Spring Lake Equity Partners、ORIX Ventures等投资机构领投。

NetBase的融资历史
NetBase的融资历史

大数据给NLP技术的发展提供了肥沃的土壤

文本自然语言处理是人工智能的重要方向,是继图像识别处理和语音处理技术(感知技术)突破之后的一个令人期待的关涉认知技术的核心环节。

在今天发达的社交网络产生了海量的文本数据,这些大数据文本给自然语言处理提供了肥沃的土壤和应用领域,包括智能搜索,情感分析,数据挖掘,问答系统和智能助理等。NetBase更早地探索了这些领域,尤其在智能搜索情感分析方面进行了多年的研发。

NetBase的核心专利家族及产品

NetBase在自然语言处理中有一个核心的专利家族,即以专利US8046348B1(Method and apparatus for concept-based searching of natural language discourse)为代表的包括6项发明的专利组合,专利US8046348B1于2006年5月29日提交申请,在2011年10月25日获得授权,发明人之一正是NetBase的联合创始人Michael Osofsky,该专利披露的是 “concept-based”搜索技术,旨在解决如何在检索中获得更为精准的搜索结果问题

基于上述技术和应用场景,NetBase于2011年3月发布了一款名为NetBase Insight Workbench的产品,该产品用于分析社交媒体和其他网页内容,为企业的市场研究人员和社交营销人员提供图表分析和研究。NetBase在其专利US9390525B1(Graphical representation of frame instances)、专利US8935152B1(Method and apparatus for frame-based analysis of search results)以及专利US9047285B1(Method and apparatus for frame-based search)中披露了该产品中涉及的部分技术。

NetBase Insight Workbench仪表板
NetBase Insight Workbench仪表板

其中,专利US8935152B1的第一发明人李维博士是Simon Fraser University的计算语言学博士,曾在Netbase任首席科学家,在Netbase期间,负责设计开发新一代搜索引擎和舆情挖掘系统。2017年3月,李维博士任京东硅谷研究院(jd-silicon valley research center)主任研究员, 领导 Y 事业部硅谷 NLP 团队,研发自然语言深度解析(deep parsing)平台及其 NLP 应用,涉及大数据情报和舆情挖掘,以及电商智慧供应链的应用等方面。

在NetBase的多项核心专利中,还包括例如为旨在通过基于网络用户的陈述来分析用户的情绪表达以获得该用户对某个品牌的认知的专利US8949263B1(Methods and apparatus for sentiment analysis);以及旨在通过网络用户在不同时间段内的表达来创建语料库并进行消费者意见分析的专利US9135243B1(Methods and apparatus for identification and analysis of temporally differing corpora)等。这些专利中公开的技术在NetBase的产品NetBase Pro、NetBase Enterprise中得以体现。

算法类专利特点及文本撰写探讨

作为本AI领域隐形冠军系列研究目的,讨论算法类专利文件撰写也是议题之一,本期我们结合NetBase的专利讨论一下算法专利文件尤其是说明书撰写中的一个问题:

我们知道,一项发明要想获得专利保护必须清楚的描述技术方案以及划定其要求保护的范围,而在现实中,当所述的发明创造涉及计算机算法或程序时,描述一个边界清晰的保护范围是不容易的,这是因为,该领域专利的权利要求中普遍采用功能性限定的手法描述技术特征,即Functional Claiming的描述方式。

这是由算法专利的特点决定的,在撰写专利文件时,专利律师并不能用计算机程序代码描述一项发明,算法专利的创新在于实现其思思和逻辑过程,而这一过程在具体的实施中通常是抽象且不可见的,因此专利代理人或专利律师很多情况下不得不采用功能加手段(means plus function claim)的语言和术语描述主张保护的技术。

另外,在专利申请文件中,一项发明的权利要求应该清楚、简明地记载主张保护的技术方案,其体现了对要求保护的发明的高度概括,由于文字的高度概括,在理解或解释其含义时经常会出现超出或不同于专利文件中技术方案的内容。

因此,在确定专利的权利要求保护范围时,首先需要对权利要求中高度概括的文字进行解读,也就是对权利要求中描述的内容进行理解。再考虑到文字在不同语境下可能有不同的含义,对不同含义的理解导致对权利要求保护范围的不同。

以上这些原因,都需要专利说明书能够给每项权利要求一个统一且充分的解释,对每一个功能模块或步骤给予清楚无歧义的定义,进而对专利律师的撰写经验和水平提出了相当高的要求。

专利文件中的术语定义直接影响专利维权

笔者认为,之所以在算法相关的专利中普遍采用功能性描述,一则是因为采用物理结构的描述方式并不能体现这类专利的创新,再则是因为计算机软件或算法的主要特点是其逻辑或功能与实现该功能的具体硬件是分开的,因为软件开发人员在编写这些程序的代码时,通常不会也并不考虑计算机的硬件细节,相应的,对一个具有计算机编程能力的人员而言,实现一个程序或算法的功能也并不必然采用相同的编程语言,编程方法和代码。

另外,还有一个不容忽视的原因,就书面语言或术语而言,在算法创新的计算机领域中,用自然语言描述一个算法或软件程序时,很难像机械领域、者化工或医药领域那样采用标准词汇或用语,也就是说,对算法或者计算机程序的创新而言,大部分情况下并无标准可循。

由于专利说明书对权利要求具有解释作用,即,在法官划定一个算法或软件专利的保护范围是往往求助于专利说明书中的描述和举例,因此在说明书中对权利要求中采用的术语或描述进行充分的解释和必要的说明就变得十分重要。例如在NetBase专利US8046348B1的文本中,针对“concept-based”的术语定义,对自然语言话语单元进行分类的过程,执行句子分类的示例性伪码程序,概念特征数据库,语义单元的示例结构,从量词类型到基值映射过程的示例以及各种应用示例做了充分的解释和说明。

专利US8046348B1的说明书截图
专利US8046348B1的说明书截图

在国内的案例中,比如前几年诺基亚诉华勤案,双方争议焦点就是对专利CN100401818C文件中术语“消息编辑器”的理解不同,导致法院以未能清晰划定权利要求的保护范围为由驳回了原告的起诉;再例如智臻网络诉苹果“siri”侵权案中的焦点也是因为“游戏服务器”的解释不充分的问题导致专利权人铩羽而归;发生在今年的判例中,搜狗诉百度的系列判决中,也有多项专利涉及功能模块限定的权利要求解释的问题。

上述维权失败的案例中无一不是存在权利要求中采用的术语得不到说明书充分解释和说明的情况,这个问题几乎已成为被诉侵权一方防御的首选策略。成功案例比如华为诉三星案,双方当事人争议焦点之一就是在对专利CN101763270B权利要求中“组件”及“容器”这些术语的理解,给力的说明书对这些术语进行了充分解释和举例使得法院的判决有据可依。

AI领域的专利维权处境尴尬

AI领域的专利在维权中通常会遭受专利适格性(这是算法专利另外一个重要的话题)或者创造性的挑战,在专利权人抵御了专利确权阶段的围攻之后,又常面临手握一项有效的专利权却难以维权的尴尬:

正如我们前面所述的,其中相当一部分原因是在专利的撰写阶段,未能在专利文本中清楚定义功能术语或者充分解释技术特征,导致法院无法清晰地划定权利要求的保护范围而维权失败。再究其原因,又多是专利律师或代理人在撰稿阶段对技术缺乏系统深入的理解以及仓促地撰写而造成的,而仓促撰写显示是与专利律师或代理人的投入时间和精力密切相关的。

* 以上文字仅为促进讨论和交流,不构成法律意见或咨询建议。