六十位重磅嘉宾、图灵奖获得者、院士、世界级技术专家、独角兽创始人用心讲课。这是今年中国最大的开发商活动。
43讲,涵盖深度学习、编程语言、开源框架、ai基础设施、企业ai架构等热点话题。这是一场知识盛宴,帮助开发者了解理论前沿和应用。
【/h/】九大链接,一个主论坛,四个子论坛,一次峰会对话,一次百度公开课,一次开源项目演示日,一次黑客马拉松,是一次丰富多样的学习之旅。
这是2020年世界开发者日。在为期2天的开发者日,大咖嘉宾们讨论并分享了开发者最关心的话题。
算法、计算能力和数据相互影响,构成ai技术发展突破的基础,推动人工智能在工业场景中的应用。
未来,如何构建ai基础设施,包括硬件、平台和框架,以满足当前人工智能应用的需求,已经成为社会上一个迫切的课题。
【/h/】2020年waic开发者日7月11日上午专门成立了“打造ai基础设施”子论坛,邀请了华为、腾讯、竹中智、京东云等众多企业专家共同探讨这个话题。竹智能CEO&创始人简仁贤以“自然语言处理实践之路”为主题,分享了新基础设施建设和企业数字化、智能化转型的新思路。
记录以下分享分论坛发言:
大家都知道自然语言处理是人工智能中的掌上明珠。人工智能主要包括视觉、语音和自然语言处理,其中nlp自然语言处理是最难的部分,相信大家都已经同意了。然后,视觉和声音的发展经过了一段时间,技术相对成熟,场景相对固定。
那么自然语言理解的场景到底有多大?自然语言理解需要处理多少问题?如何将自然语言理解与人工智能技术相结合,在行业内落地,通过行业应用场景产生更多价值?这就是我们今天要讨论的问题。
【/h/】竹内智能从2015年成立到现在的五年时间里,一直专注于自然语言和基于情感计算,打造流畅的人机交互,追求带温度的交互机器人,解决人与机器的交流问题。不仅如此,我们也在解决人机合作的问题。Takenaka应用自然语言处理技术解决非结构化数据,即从文本分析的范围来看,它还将人机交互、沟通协作应用到业务自动化和流程自动化中,解决业务问题,提供更好的端到端服务。所以自然语言理解和情感计算是竹子智能的两个主轴。
在过去的五年里,竹子一直在沉淀和积累工业场景。今天,我想和大家分享一下如何实现自然语言理解。在过去,我的老上司沈向洋博士曾经说过,“懂语言的人赢得世界”,也就是说,在未来的世界里,无论是生活、工作还是娱乐的方方面面,都将得到语言的辅助。无论这种语言是人与人之间,人与机器之间,还是未来幻想中的机器与机器之间的交流语言,语言都会成为人类生活中的操作系统,所以懂语言的人会赢得世界。如果他们能彻底理解语言,他们就能帮助人类在言语交际中发挥协调和赋权的作用。
【/h/】这五年来,Takeshi把自然语言的这些技术应用到各行各业,沉淀了很多场景,把场景转化为产品和平台,把产品变成平台,把平台当成产品。目的是帮助企业更快、更安全、更顺畅、更低成本、更高效率地应用nlp。依托竹bot厂& # 8482;这个产品平台沉淀了上百个标杆客户。在过去的五年里,它建立在自主开发的自然语言理解和情感计算技术以及知识工程技术的基础上,使机器人能够真正理解、理解和阅读,也能够解决所有人的商务问题。竹智的长久愿景:
每个人的情感机器人,
每家企业,每台智能设备
所以我们在这里连接人、企业和终端,成为情感机器人,并赋予人类生态权力。
抓住nlp
今天我想告诉大家的是,如何在人们的生活中寻找nlp机会,如何赋予企业权力,帮助个人更好、更方便、更有效地生活。
企业普遍存在以下困难。第一,营销可以赢得客户,企业可以赢得客户,新的业务可以生存,可以为客户提供更好的服务。
第二,提高服务质量。有了新客户,如何服务现有客户进行保留和转型,需要提供更好的体验,让企业拥有可持续的商机,让客户享受到更好更值得的优质服务。那么,核心点就是企业要降低人工成本。另外,今年的疫情给我们带来了一个思考,就是未来如何在各方面减轻劳动力压力,进而降低劳动力成本?通过技术降低人工成本和压力。未来的世界实际上会减少接触。接触少不代表没有社交。社交当然是必须的,所以社交距离是需要的,但是当接触没有必要的时候,尽量避免。
【/h/】比如你要付款,是不是要在网点付款?办信用卡一定要去网点吗?如果通过电话使用信用卡,机器人能自动帮助客户解决这些繁琐的事情吗?有了这些机会,未来有哪些场景可以用来帮助人类提供有价值的服务?其中最重要的一点是,解决人与人之间的交流和互动问题,依赖于语言,所以我们必须彻底理解和认识人类的语言,通过计算机语言把语言变成可计算的东西。这个学科很窄,但却是最高最深的一个,因为它需要了解的不仅仅是人类心理学,还有语言学,人机交互,这三个非常重要的技术学科。只有了解了这三个学科,才能真正称得上懂计算机语言。当我们谈到情绪计算模型时,它是基于心理交互模型的,需要将语言学和情绪融合到最先进的人工智能中,这样才称得上是交互的。交互没有触摸屏那么简单。语音交互只是一种感官交互。用眼睛看图像也是一种感官互动。图片不会理你。真正的互动应该是一个相互的过程和动态的。人脑到底是怎么回事,当他说出一句话的时候,他的语境是什么?他是什么心情?这个很重要,需要融合计算机语言、自然语言处理和心理学来实现真正的交互。这条路需要很大的努力。
未来NLP的关键技术点
NLP的技术难点是什么?这是武士道5年总结出来的一些经验,我个人做了20多年。之前还有很多技术难点。我们一一克服之后,随着技术的不断发展,会出现新的技术难点,当然越来越有挑战性,越来越有价值。第一,少样本零样本学习。这是这两三年来岗前培训模式的兴起,让大家开始思考。能否用更少的样本和数据进行训练,实现预训练,使语言模型在未来更加通用?因此,这是一个具有挑战性的方向,我们应该共同努力减少学习样本,丰富模型交互的模型,更快地完成训练。第二点是预训练模型的压缩。当然,众所周知,预训练模型需要的维度范围很广,数据量很大,建立的模型也很大。如何尽可能的压缩,如何超越bert,使之小于bert,训练速度更快,需要的样本更少?这样的模型要靠大家各方面的经验来优化迭代。
【/h/】第三点很重要,就是自然语言处理是和人类语言打交道,缺乏知识,认知,包括常识。以前我们做单词向量,句子向量,把单词变成向量,用向量来计算。缺乏知识和常识,没有语境分析。现在上下文分析慢慢加入到技术中。但是,单单语境还是不合逻辑的。没有知识和常识的nlp,没有认知互动,就没有办法实现有意义的互动。所以很重要的一点,竹子的核心是做多模态多模态计算,给交互添加情感,把声音,语义,图像,人眼能看到的,耳朵能听到的,脑袋能思考的,嘴巴能说的综合起来做多模态交互。有时候不需要语言,只需要和眼睛互动。有时候你不需要语言,但是你用表情来互动。有时候可以在不同的场景中运用情绪。当然,情感识别不仅仅是识别语调和声音,需要将这些融入多种模式,这是最难的部分,也是我们最终的目标。能够模拟人的多模态交互,再加上认知交互和情感交互,才是人机交互的最终目的。今天我们在做单词向量,bert和语义理解,这是一个步骤。要实现多模态语义理解,必须同时结合整个文化发展、经济发展和人类历史发展进行研究,这是一个累积的过程。自然语言生成很重要,人类语言是有逻辑的。并不是深度学习模式不能控制随便生成一个句子,也不是可以用大量的互联网语料库去钓鱼一个句子进行对话,否则根本就没有逻辑可言。所以,自然语言能否生成,需要逻辑交互。当然,你可能是在聊天。聊天不是逻辑上的,是感情上的。情感也是一种逻辑。nlg中加入了人类理性和情感,因此自然语言的生成可以实现完整的人机对话。非常重要的一点是,知识发现和推理在交互中非常重要。如何在交互中自动发现一个知识,一个新的实体,一个新的知识,这就叫做上下文,即如何识别和提取上下文。需要理解的是,实体的自然发现和知识的自动发现可以解决上下文的问题。上下文不仅仅指解析,更重要的是指知识,其中可能有多个实体和属性。对话中的语境需要解决对话中自动发现知识和自动发现信息的问题,从而实现流畅的语境互动,自然形成所谓的多轮互动。因此,当前的对话交互是基于认知人工智能、情感人工智能和双向交互人工智能的,这需要在撰写文本之前理解上下文环境中的各种信息。这叫目标导向的对话,目标导向的对话。每一次革命都还是一个目标,每一次需要解决的互动都是为了解决一个目标。可能需要完成多个目标才能实现交互。
所以除此之外,非常重要的一点是,模型越复杂越不可控,可以说是超出了可控范围。如何才能保证人工智能技术的交互技术可控?需要做到的是,所有的实体,比如在交互过程中获得的信息和识别的知识都是可解释的。你在哪学的机器?你是怎么学的,学了什么?可以解释,可以控制。人工智能的人性最终是要保护人类,而不是伤害他们。是为了帮助人类更好的生活,所以机器学习的数据、语料库、文本、图像都是可解释的,这一点非常重要。
那我就来讨论一下如何解决语义解析的难度。很重要的一点是场景。有了场景,我们可以应用自然语言处理来发挥它的价值,当它应用到场景中时,也会产生更多的数据反馈。那么如何练习复杂场景呢?比如:逾期提醒、快递、问卷回访,我们做了上百个不同的场景,每个场景都要通过分析不同的技术水平来解决。那么,在类脑语言的解析层,人脑中有超过十亿个神经元代理,每个代理代表一个工作。如何把它拆分成最小的单位来分析然后理解。包括语境理解、知识推理、回指消解等等,有几十个不同的小组件需要解决。然后是底层算法,包括互联网、分词、词性、ner、关键词、依存解析、语义解析、语义角色标注等。几十个语言模块能否完全由ai一个个完成,可以用最新的机器学习和深度学习方法来构建,是语义分析的难点。举个简单的例子,“车票购买成功了,但是车票没发怎么办?”这句话的用意很简单:我想知道我的票已经买了,但是不会发行。我该怎么办?但是如果中间有区别,比如“我买票成功了,但是买不到票怎么办?”不出票和不出票一个字差别很大。如果你拿不出来,那是动词,不是拿出来。汉语中没有空格,因此有必要解决一个非常重要的分词问题。一般市面上的分词工具基本解决不了这个问题,也分不清“无票”和“无票”。那么如何解决这样的问题呢?积累了大量的行业数据,又要跨行业去解决,所以需要有大量的数据和大量的模型去构建,才能让解析在一个语音引擎中更具普适性,遇到这样的问题才能明白说话人的真实意思是什么。其实这是一个很难克服的问题。竹子现在已经克服了。
比如上海话中“我不太喜欢这双鞋”的一般分词或者翻译就会翻译成“我不太喜欢这双鞋”。但这句话的正确含义其实是:我太喜欢这双鞋了,这就是为什么我无法理解语言的真正含义来进行翻译。这样的语料库无法产生非常准确和可解释的路径。
【/h/】还有一点就是,如何把认知的部分和人类知识计算的部分相加?我们的人脑可以进行逻辑计算。如果我一个月用一万,我一年就用十二万。但是目前一般的语义对话聊天机无法完成计算。如何将实体数与常识知识结合起来,让整个引擎都能计算出来?例如,在申请信用卡、贷款或保险时,保险公司或贷款公司需要进行风险评估并询问收入。如果你回答:我月薪2万,老婆是课程顾问,年收入20万左右。那么你家的收入是多少?普通分词分不清,因为里面有什么?首先涉及到各类ner的提取,一个月2万,一年20多万。你能分析一下这20多万是年薪,2万是月薪吗?然后总结一下,这就是机器模型要做的。那句话还包含了“我老婆是课程顾问”的信息。所以那句话里有两个实体,“我”和“我老婆”是有关系的。当然,关系是配偶关系。如果你能提取这个信息页面,你就能建立一个知识渊博的影响力。另外计算可以算出家庭年收入2万× 12+20万= 44万。结果传输到风控系统进行评估,评估结果通过机器人传输给客户。这被称为人机对话,它访问企业的内部计算系统,并实现一个编译器、一个测试和一个目标。这是最经典的例子,看似简单,其实很难做到。这不仅仅是一个聊天机器人或者语音助手,还需要具备认知、常识、计算和语言学,通过整体的语境理解,才能在仅仅3个字或者30个字的时间里获得真实的信息和意图。如何准确的提取出所有的对话信息是现在最需要做的工作,武士道已经取得了不错的成绩,未来还会继续努力突破越来越难的语义问题。
语义解析还有一个难点。我们举个简单易懂的例子:“开手机银行能付油钱吗?怎么打开?怎么交?”在这样一个问题里,“开手机银行能付油钱吗?”这是一个常见问答——常见问题,也就是faq,但是句子后面是“怎么打开?怎么交?”有两个意图:一是如何开通手机银行;二、如何支付油费?所以这句话包含了一个共同的问答和两个意图。因此,机器人需要解决三件事。首先,他们需要提取关键信息。手机银行是关键信息,煤气费是关键信息,开通支付是关键信息。组合后,他们分析多个意图,然后根据事件逻辑与后台系统对接,回答。他们也可以在推荐问题的引导下,不断与用户交谈,解决用户的问题,从而形成完善丰富的服务闭环。因此,多意图、多实体和信息提取的课题已经发展了几十年,我们一直在不断优化它,直到现在。信息挖掘、信息检索这些传统的文本分析和文本处理技术,都是在人工智能的今天实现的。
竹智能646战略
最后我来介绍一下竹子的三大支柱——“646战略”。包括竹子的六大核心技术,这是我们一直关注的方向;四大核心产品平台是过去五年打磨的结果。它既是平台,也是产品;在六大产业中,竹子建立了跨行业合作。
六大技术方向包括自然语言处理、知识工程、深度学习& amp;自动,文本数据,视觉计算,语音识别,botfactory集成在竹& # 8482;站台。Takeuchi的所有内部开发和定制开发都基于自动化机器学习平台,包括微调、预训练等各种模块,实现零代码开发。二次开发,客户也可以用自己开发的模型代替我们自建的模型,这样整个bot工厂& # 8482;它是一个非常强大的模块和引擎,当然它也包含一个巨大的nlp技术模块。文本数据的中间平台是文本分析在企业中的应用,而视觉计算也是近五年在竹子中积累的面部表情、情感识别技术,如面具识别、活体识别等的应用。语音识别是武士道除了语义之外很好的一部分,现在武士道的asr和tts技术已经和科大讯飞、阿里结盟。Takeuchi结合了语音和语义技术,形成了全双工全场景aicc解决方案。
那么从这六项技术来看,我们这几年沉淀了四个平台,bot factory & # 8482平台可以零代码一键部署,让用户不用写代码就能创建机器人。在一些跨行业领域,竹机器人可以达到零起步的水平,也就是不需要训练,准确率可以达到80%以上。然后经过后期的语料库训练和实际操作准确率,可以提高到95%甚至97%。
aicc是朱坚ai联络中心的整体解决方案,可用于企业的呼叫中心。例如,与朱坚合作的avaya将人工智能技术引入呼叫中心。现在朱坚呼叫中心有八种不同的产品。aicc产品包括智能客服和AI质量检测。辅助座椅、陪练机器人、培训、用户画像分析、营销分析,都构成了aicc的全方位解决方案。那么,如果语音和语义重新融合,我们在所有场景下都是一个aicc解决方案,有了我们语音、语义和图像的整体解决方案,那么企业就不需要找其他不同的ai厂商做非常复杂的集成。这是竹子能提供的。一站式企业级人工智能平台,由四个平台组成。
还有nlp平台,它不仅是nlp的一个api,也是nlp的一个操作系统。企业客户和终端客户需要做nlp二次开发,所以这个系统可以部署。该系统可以使企业进行数据处理、培训、运维、测试和在线。nlp平台的27个模块可以帮助企业做对比,完成稿件校对、同行评议等多项业务。
那么不仅仅是构建知识地图,它是一套完整的技术平台,也就是说,这套完整的技术平台可以被许可给企业,让企业可以利用这个技术平台自动构建知识地图,而不是手工构建知识地图。目前,一些传统知识地图的制造商通过手动连接实体来创建知识地图,这不是自动的。竹中双子可以通过自动化创建知识地图。它可以通过解析100万个文档和200万个文档来构建知识地图,还可以给它一个预定义的词库和预定义的知识。它还将自动发现和发现属性和实体,因此它可以形成人机交互。如果它做不到什么,就会被人工干预。因此,构建知识地图是一个自动化的项目。它还有灵感引擎和强大的过程引擎,可以处理过程自动化的所有问题。
这四大产品平台在过去的五年里,在六个行业积累了六项技术,包括金融行业、智能终端行业,如智能手机,包括传统行业、互联网行业、医疗、教育。行业内有银行等六大行业,包括北京银行、中国建设银行等。,还有aiot华为,oppo,还有优和Cobos。央企的客户有华润所以这么多年来,我们也很感谢能够和几百家标杆企业合作,包括这些行业的很多大企业。今年整个疫情爆发后,更多的企业用户开始采用nlp的这些场景,所以nlp行业正在复苏。我相信nlp将是一个比视觉行业和声音行业大几百倍甚至几千倍的行业。在未来的十几二十年内,它将成为一个操作系统进行人机交互的主要核心技术。
标题:[商业信息]竹间智能CEO简仁贤谈NLP落地修炼之道
地址:http://www.baoduan3.com.cn/sy/2607.html