从AI相关案例出发,浅谈人工智能和机器学习相关专利申请的审查意见答复思路以及对撰写的反思

2019-11-01

  文/集佳知识产权代理有限公司西安分部 张艺

   

  EPO审查指南Part G‑II, 3.3.1中,对有关人工智能和机器学习的发明做出了详细规定。

  人工智能和机器学习基于用于分类,聚类,回归和降维的计算模型和算法,例如神经网络,遗传算法,支持向量机,k均值,核回归和判别分析。这样的计算模型和算法本身具有抽象的数学性质,而不管是否可以基于训练数据对其进行“训练”。 因此,G‑II 3.3.1中提供的指南通常也适用于此类计算模型和算法。

  根据上下文,诸如“支持向量机”,“推理引擎”或“神经网络”之类的术语可能仅指抽象模型或算法,因此它们本身并不一定意味着使用技术手段。在检查所要求保护的主题是否具有整体技术特征时,必须考虑到这一点(第52(1),(2)和(3)条)。

  人工智能和机器学习在各种技术领域中都有应用。例如,

  在心脏监测设备中使用神经网络以识别不规则心跳的目的做出了技术贡献。

  基于低级特征(例如,图像的边缘或像素属性)的数字图像,视频,音频或语音信号的分类是分类算法的进一步典型技术应用。

  但是,仅根据文本内容对文本文档进行分类本身不被视为技术目的,而是一种语言目的(T 1358/09)。

  即使可以认为分类算法具有有价值的数学属性(例如鲁棒性),但对抽象数据记录甚至“电信网络数据记录”进行分类,而没有任何迹象表明对所得分类进行技术用途,这本身也不是技术目的。(T 1784/06)。

  在分类方法用于技术目的的情况下,如果生成训练集和训练分类器的步骤支持实现该技术目的,则它们也可以有助于本发明的技术特征。

  欧专局专利和实用新型审查手册(Examination Handbook for Patent and Utility Model)附录A中增加了10个AI相关案例。以下,通过其中的一些案例来浅谈AI相关发明的审查意见答复思路以及在撰写时需要注意的问题。其中案例使用了附录中的序号,便于读者查找原文。

 

  是否属于可授权主题-Article 52 (2)

  欧洲专利公约(European Patent Convention)52 (2)规定,以下内容不应视为第1款意义上的发明:

  (a)发现,科学理论和数学方法;

  (b)美学创作;

  (C)进行心理行为,玩游戏或经商的计划,规则和方法,以及用于计算机的程序;

  (d)信息展示。

  在以上规定的范围内,“数学方法”是电学领域比较常见的申请,其中人工智能和机器学习类方法尤为常见。这些申请在撰写不当的情况下,例如权利要求1的前述部分为一种模型获取或训练方法,或者与模型相关的数学方法,常常会引发EPC 52 (1)和(2)意见。

  ▪【案例47】商业计划设计设备装置

  1.一种商业计划设计设备,包括:

  存储装置,用于存储特定产品的库存量;

  接收装置,用于接收网络广告数据和特定产品的提及数据;

  模拟和输出装置,用于使用估计模型、基于网络广告数据和特定产品的提及数据来模拟并输出特定产品的未来销售量,通过机器学习使用包含网络广告数据和过去已售出的类似产品的提及数据以及类似产品的销售量的训练数据对所述估计模型进行了训练;

  生产计划制定装置,用于基于所存储的库存数量和输出销量来计划特定产品的未来生产数量;以及

  输出装置,用于输出输出销量和生产计划。

  【拒绝原因概述】

  没有拒绝的理由。

  通过以上案例,可以看到权利要求1的技术方案使用训练模型解决了一个具体的技术问题,即:基于库存量来估计输出向量和生产计划,其除了估计模型以外,该方案至少还包括用于接收模型输入的接收装置和输出模型输出结果的输出装置。

  因此,如果遇到52(2)问题,可以参考以上权利要求,把独立权利要求限定为“在某个领域解决了某个技术为题的方法”。

  进一步地,为了避免52(2)问题,独立权利要求应当避免以“模型生成方法”等仅与模型本身相关的数学计算内容作为前述部分。其次,如果独立权利要求涉及的使用模型解决技术问题的方法没有限定领域,仅仅是“特征提取和分类方法”等比较概括的描述,这样虽然会覆盖一个比较大的保护范围,但也可能引发52(2)问题。以上两种情况下,说明书中都至少应该包括一个使用该模型来解决具体技术问题的实施方式,例如包括,获取何种输入数据,并且通过已训练的模型来获得期望的输出。避免遇到52(2)问题时,没有修改基础。

  

  是否能够得到说明书支持-日本专利法案Article 36(6)(i) (Support Requirement)/Article 36(4)(i) (Enablement Requirement)

  在使用数学模型来解决具体问题时,会涉及到各种输入数据。通常,为了覆盖一个比较大的保护范围,通常独立权利要求中会使用上位概念来进行概括。这种情况下,应该尤其注意该概念能否得到说明书的支持。

  ▪【案例49】体重估算系统

  1.一种体重估计系统,包括:

  模型生成装置,用于使用训练数据通过机器学习来生成基于表示人的脸部形状和身高的特征值来估计人的体重的估计模型,训练数据包括代表面部图像的特征值以及人体的身高和体重的实际测量值;

  接收装置,用于接收人的面部图像和身高的输入;

  特征值获得装置,用于通过分析经由接收装置接收到的人的面部图像来获得代表人的面部形状的特征值;以及

  处理装置,用于基于表示特征值获取装置已经接收到的人的脸部形状的特征值和特征值获取装置已经接收到的人的身高的特征值,输出人的体重的估计值。接收装置,使用由模型生成装置生成的估计模型。

  2.根据权利要求1所述的体重估计系统,其特征在于,表示面部形状的特征值是面部轮廓线角度。

  说明书概述:说明书中仅描述并图示了面部轮廓线角度作为“代表人的面部形状的特征值”,没有其他特征值。

  【拒绝原因概述】

  权利要求1:第36(6)(i)条(支持要求)/第36(4)(i)条(实现要求)

  权利要求2:没有拒绝理由。

  在以上案例中,在独立权利要求中将“面部轮廓线角度”概括为上位概念“代表人的面部形状的特征值”。该概括得不到说明书的支持。为了争取较大的保护范围进行的上位概括,应该尤其注意是否得到说明书的支持,并且在撰写过程中,需要公开尽可能多的实施方式。否则遇到该审查意见时,只能将该特征修改为所公开的概念,有时会将权利要求限定为一个发明人所不希望的过小范围。

  

  是否具有创造性

  AI相关发明的创造性,同样着眼于“区别技术特征能否产生无法预期的显着效果”。值得注意的是,是否应用了AI相关技术,或者使用了何种AI相关技术,很可能不产生无法预期的显著效果。

  ▪【案例33】癌症水平计算装置

  1.一种癌症水平计算设备,其通过使用对象的血液样本来计算对象物患癌症的可能性,包括:

  癌症水平计算单元,其响应于通过对对象的血液分析获得的A标记物和B标记物的测量值的输入来计算所述对象患有癌症的可能性,

  所述癌症水平计算单元包括神经网络,使用训练数据通过机器学习对所述神经网络进行了训练,以响应于A标记物和B标记物的测量值的输入来计算估计的癌症水平。

  对比文件1公开了癌症水平计算方法,其由医生使用被检者的血液样本来计算被检者患有癌症的可能性,该方法包括以下步骤:

  癌症水平计算步骤,其中使用通过对受试者进行血液分析而获得的A标记物和B标记物的测量值来计算受试者患癌的可能性。

  【结论】

  权利要求1的发明没有创造性。

  【拒绝原因概述】

  被引用发明1和公知技术都涉及疾病可能性的估计,并且它们具有要解决的共同问题。本领域技术人员可以容易地想到通过将公知技术应用于被引用发明来将由医生进行的对象人患癌症的可能性的计算方法系统化。

  此外,本领域技术人员可以容易地预期权利要求1的发明的效果。而且,没有发现将公知技术应用于引用发明1的阻碍因素。

  ▪【案例34】水力发电量估算系统

  1.一种大坝水力发电量的估算系统,包括:

  神经网络,所述神经网络通过信息处理器构建,具有输入层和输出层,其中输入到输入层的输入数据包含在参考时间和参考时间之前的预定时间之间的预定时间段内河流上游的降水量,所述河流上游的水流量,流入大坝的水流量,以及在参考时间之后包含水力发电能力的来自输出层的输出数据;

  机器学习单元,其使用与输入数据和输出数据的实际值相对应的训练数据来训练神经网络;以及

  估计单元,将输入数据输入到经由机器学习单元训练的神经网络中,并将当前时间设置为参考时间,然后基于参考时间为当前时间的输出数据来计算未来水力发电能力的估计值。

  2.根据权利要求1所述的水力发电容量的估计系统,其中,所述输入层的输入数据还包含所述基准时间与所述基准时间之前的所述规定时间之间的所述规定期间的所述河流的上游温度。

  【现有技术】

  对比文件1公开了一种水力发电量的估计系统,其通过信息处理器执行多元回归分析,包括:

  回归方程模型,其中解释变量是在参考时间和参考时间之前的预定时间段内,河流上游的降水量,河流上游的水流量以及流入大坝的水流量,目标变量是参见时间之后的将来的水力发电量;

  分析单元,其基于与解释变量和目标变量相对应的实际值来计算回归方程模型的部分回归系数;以及

  估计单元,其将以当前时间设置为参考时间的解释变量的数据输入到由分析单元计算出的部分回归系数的回归方程模型中,然后基于来自将当前时间设置为基准时间的目标变量的输出数据来计算未来水力发电能力的估计值。

  【公知技术】

  在机器学习的技术领域中,众所周知,通过使用经由包含过去的时间序列数据输入和将来的特定输出训练的神经网络,基于过去的时间序列数据的输入来进行将来的输出的估计处理。

  【结论】

  权利要求1的发明没有创造性。

  权利要求2的发明具有创造性。

  案例33中,与对比文件的方案相比,区别技术特征仅在于神经网络的应用,而该应用无法产生“无法预期的显著效果”,那时该发明很难被认为有创造性。

  相比之下,案例34中的区别技术特征除了本发明使用了神经网络,对比文件使用了回归方程模型以外,本发明使用了“所述河流的上游温度”作为输入来估计水利发电量。由于春季的融水而导致的流入量的增加,因此能够高精度地估计水力发电量,因此该区别技术特征产生了本领域技术人员无法预期的显著效果。

  可见,在答复AI相关发明的创造性时,应该更多考虑方法中的区别技术特征是否能够产生无法预期的显著效果。训练模型的应用,通常只能够“提高计算效率”,从这个角度争辩很难被审查员接受。但是在OA答复过程中,笔者发现,说明书中常常会重点描述所使用的模型或数学方法,对其具体应用描述较少,这对后续OA意见的答复造成了很大困难。

  人工智能、机器学习等等正在广泛应用于各个领域,相关申请数目也在增加。关于以上提出的三类审查意见:是否属于可授权主题、是否得到说明书支持、以及是否具有创造性,答复的思路与其他领域并无很大区别。但是笔者在翻译新申请和答复审查意见的过程中发现,在此类申请的说明书中,往往更加关注模型或数学方法本身,对其应用确缺少详细描述,往往是略提几笔,或者甚至没有。这造成在后期答复审查意见时,代理人面对的是“无米之炊”。因此笔者建议此类申请的撰写过程中,更多地考虑“使用人工智能和机器学习解决了何种具体的技术问题”,而不是“使用了何种计算模型和算法”。  

  

此篇文章由北京集佳知识产权代理有限公司版权所有,转载请注明出处     

 

相关关键词