肥宅钓鱼网
当前位置: 首页 钓鱼百科

机器学习的数值预测(基于BERT的单模型NLP权威测试全球第三)

时间:2023-08-07 作者: 小编 阅读量: 1 栏目名: 钓鱼百科

目前计算智能与感知智能,机器已经可以媲美甚至超越人类,但认知智能方面与人之间依然存在差距。小i机器人参赛模型在此次比赛中获得EM指标达到88.650,F1指标达到94.393的成绩。SQuAD被誉为自然语言处理领域金字塔尖的比赛,旨在促进智能搜索引擎的发展。正因如此,小i机器人一直坚持“大脑”研发。此标准也在今年8月正式通过国际标准草案投票。凭借此次合作,小i机器人用户达到近一亿人次,同时,此举让小i积累起了庞大的中文语义库。

机器学习的数值预测?【新智元导读】近日,凭借自研BERT WWM MT的单模型,小i机器人在国际权威机器阅读理解评测SQuAD1.1挑战赛中排名全球第三深耕行业18年,这家国产AI公司认为认知智能才是AI未来竞争的核心,并快速推进产业化应用——在商用智能客服领域,行业市场占有率已超过80%,今天小编就来聊一聊关于机器学习的数值预测?接下来我们就一起去研究一下吧!

机器学习的数值预测

【新智元导读】近日,凭借自研BERT WWM MT的单模型,小i机器人在国际权威机器阅读理解评测SQuAD1.1挑战赛中排名全球第三。深耕行业18年,这家国产AI公司认为认知智能才是AI未来竞争的核心,并快速推进产业化应用——在商用智能客服领域,行业市场占有率已超过80%。

一家中国人工智能技术公司成立长达十八年之久,还在成长期赶上了第三次AI浪潮。

作为有着这样背景的小i机器人对未来AI发展有着更成熟且明确的方向:

认知智能是人工智能未来竞争的核心。

而认知智能技术需要多向积累,技术和应用互生互补。除18年产业应用经验外,小i机器人在AI技术方面仍在不断突破:

  • 凭借最新研究成果——BERT WWM MT的单模型,在由斯坦福大学发起的国际权威机器阅读理解评测SQuAD1.1挑战赛中排名全球第三,超越人类平均水平。不同于前两名企业 学校的联合模式,小i完全是由研究院团队独立完成;
  • 分别实现了基于机器学习和深度学习方法的各个NLP基础能力模块,覆盖了词法分析、句法分析、语义分析、篇章分析等基础技术的能力;
  • 参加情感计算国际标准建设,并在其中担纲重要角色。

    另外,不同于近几年成立的AI公司,小i早就开始推进认知智能商业化——小i机器人以开辟智能客服这一典型AI应用场景为基础,在金融、汽车、医疗等数个行业均有布局,其中商用智能客服领域,其行业市场占有率已超过80%

    迈向认知智能的技术底气:自研BERT WWM MT的单模型,NLP权威测试全球第三

    现在大家习惯将人工智能分为三个台阶,计算智能、感知智能和认知智能,认知智能位于AI金字塔结构的顶部。

    目前计算智能与感知智能,机器已经可以媲美甚至超越人类,但认知智能方面与人之间依然存在差距。

    认知智能是人工智能发展的未来趋势。

    认知智能涉及到语义理解、知识表达、联想推理、智能问答、自主学习。人工智能的一个重要目标就是希望机器能够与人类进行更加自然高效的交流,希望机器读懂人类深奥的语言,同时以一种我们习惯的方式进行交互。

    其中,使机器读懂人类深奥的语言、同时也是认知智能方面最典型的任务就是阅读理解。

    2019年7月,小i机器人研究院团队在由斯坦福大学发起的国际权威机器阅读理解评测SQuAD1.1挑战赛中,凭借最新研究成果——BERT WWM MT的单模型,以EM(精准匹配率)和F1(模糊匹配率)超越人类平均水平的优异成绩排名第三。

    此次在考虑Whole Word Masking的BERT预训练模型基础之上,小i引入辅助任务如NewsQA等数据集,采用多任务学习的思路来改进现有模型的效果,进一步提升模型的最终预测评价指标(主要为Exact Match和F1值)。

    具体来看,小i分别对目标任务和辅助任务中的答案集合进行长度频率统计,以及各自训练一个语言模型,来综合判断辅助任务中的数据样本与目标任务中的数据样本之间的相关性。

    最后将这个相关性指标进一步引入到模型训练过程中损失函数Loss的计算过程中,以充分利用并学习到来自目标任务和有关辅助任务中的知识,从而最终提升模型的预测效果。

    小i机器人参赛模型在此次比赛中获得EM指标 (精准匹配率)达到88.650,F1指标(模糊匹配率)达到94.393的成绩。

    排名前两位的谷歌大脑和Facebook人工智能研究部门都选择了与高校联手进行挑战,而小i机器人则是完全独立参加比赛。

    SQuAD被誉为自然语言处理领域金字塔尖的比赛,旨在促进智能搜索引擎的发展。

    国际机器阅读理解评测SQuAD自2016年发布以来,共吸引了包括谷歌、微软亚洲研究院、IBM研究院、阿里巴巴达摩院、上海交通大学等众多国内外知名研究机构和高校参加。

    而在实际应用中,小i也把机器阅读理解的最新研究成果应用于有关产品和实际项目中。例如,在小i机器人开发的Bot开放平台中,集成了基于机器阅读理解的能力。

    除此之外,小i机器人分别实现了基于机器学习和深度学习方法的各个NLP基础能力模块,覆盖了词法分析、句法分析、语义分析、篇章分析的基础技术的能力,上述的机器阅读理解即为其中的能力之一。

    小i机器人创始人、董事长兼CEO袁辉曾表示:感知、思考、运动三部分构成了人工智能,其中最核心的是拥有思考力的“大脑”,也就是认知智能,它决定着人工智能的水平高度。当机器的认知能力获得重大突破,AI的应用度和渗透力就会更强。

    正因如此,小i机器人一直坚持“大脑”研发。

    目前,小i机器人已在上海、贵阳、深圳、南京、香港、美国硅谷设立6大研发中心,与华东师范大学、香港科技大学、中国科学院软件所等建立联合实验室。在自然语言处理、深度语义交互、机器学习和大数据等认知智能相关以及图像、语音识别等核心技术上拥有全面、自主的知识产权。

    推动情感计算国际标准建设,将情感量化成机器能理解的数值

    在认知智能中,除当下热门的各项NLP能力外,小i机器人专攻另一独特技术方向——情感计算即将人类情感量化成机器可以理解的数值。

    事实上,认知智能的发展分为语言理解、分析推理,以及人格和情感三个层次,情感可以说是AI金字塔顶尖中的顶尖,是AI最终需攻克的难关之一。

    情感计算的概念早在1997年由MIT媒体实验室Picard教授提出,她指出情感计算是与情感相关,来源于情感或能够对情感施加影响的计算。

    在用户界面中的对情绪交互信息的表示方式,仍缺乏规范化和统一的标准,使得人机交互中对用户情绪信息的理解、处理,以及情绪的回馈呈现等过程存在差异,阻碍了情感计算用户界面的应用和发展。

    2013年着手研究情感计算以来,小i机器人在 2017年作为牵头单位之一提交了国际上第一个有关情感计算的国际标准ISO/IEC 30150-1《信息技术 情感交互 第一部分:模型》,这也是中国在该领域的首个国际标准。此标准也在今年8月正式通过国际标准草案(DIS)投票。

    事实上,情感计算的应用前景相当广阔,用户与计算机系统之间依然存在情绪和表达上的障碍,如果制定相关国际标准,将有利于实现情感计算用户界面的应用推广。

    今年8月,小i机器人联合中国电子技术标准化研究院和中国科学院软件研究所三家共同提交了ISO/IEC 30150-11《信息技术 情感计算用户界面 Part 11:情绪表示》和ISO/IEC 30150-2 《信息技术 情感计算用户界面 Part 2:情感特性》。

    深耕行业18载,崛起之路是偶然也是必

    认知智能技术需要多向积累,技术和应用互生互补,螺旋上升。小i很早就入局智能机器人行业,在这方面已有深厚的积累。

    2001年,小i机器人在上海成立,但它最早出现在大众视野是在2004年。那一年,小i机器人出现在MSN和QQ这两大社交软件上。凭借此次合作,小i机器人用户达到近一亿人次,同时,此举让小i积累起了庞大的中文语义库。从那以后,小i机器人开始进入聊天机器人和AI领域。

    自2008年江苏移动i8智能客服上线后,小i打开了企业智能客服的大门

    此后,小i在智能客服领域迎来爆发期,合作对象也拓展到联想、联通、建行、招行等大型互联网、电信和金融机构。它们的机器人均使用了来自小i机器人的技术作为支撑。

    除此之外,通过技术和资源的开放,小i还试图激活AI时代开发者潜力,共享AI红利,同时也使生态体系建设初具规模。

    小i机器人发布了新一代智能Bot开放平台,集合了Chatting Bot、FAQ Bot、Discovery Bot三大核心能力以及深度学习、知识管理、知识学习、计算机视觉、知识融合等基础能力。

    目前,平台支持智能客服场景的直接使用,为企业和开发者提供机器人服务无缝转人工服务以及通过智能学习构建知识库的完整使用闭环。除此之外,企业和开发者还可通过标准接口获得各类定制服务。

    以智能客服为突破口,走出一条真正的“产业化之路”

    在人工智能的浪潮中,客服被认为是最先被取代的一类人群。传统的人工客服往往都是高密集性劳动,而智能客服可很好地改进成本高、服务效率低等问题。

    人工智能技术有望在智能客服领域率先完成商业化落地。根据Gartner预测,2020年左右85%的客服服务都将由人工智能完成。

    在小i的生态产业落地领域当中,智能客服是主要业务方向之一。

    据了解,小i机器人在智能客服实现过程中,技术层面主要分为三块:一是自然语言处理和理解技术,二是需要机器人掌握根据上下文进行推理的能力,三是在不同领域中,利用人和机器的协作,半自动化地构建各行各业的知识体系。

    作为国内智能客服领域的开拓者,小i在商用智能客服领域,行业市占率已经超过了80%。

    如今,小i机器人的业务涉及电信运营商、银行、证券行业、互联网金融、机场、电商、汽车、3C、医院、房地产、酒店、手机、物流、餐饮等各行各业。

    从技术、产品到解决方案、服务体系、再到生态建设,小i机器人这18年来稳扎稳打,为业界踏出了一条真正的“产业化之路”。

    • 推荐阅读
    • 路虎卫士到底厉害在哪里(长城与路虎已经悄悄成立了合资公司)

      紧接其后的则是长城高端炮的底盘轻量化项目,例如上海车展上的X炮的量产化版本,注意这三个项目都是集中在一起的,说明都是归属长城的没跑。光速正好相反,签约之后三年才开始项目推进,甚至可以说是与长城路虎项目同期推进;看来双方密谋许久。

    • 重庆浪漫情调的餐厅(情人节氛围拉满)

      今年的情人节,这里的迎宾玫瑰是“夏日恋情”,暖fufu的颜色,爆赞!今年情人节,花执时光推出了520套餐,玫瑰桌花,晚蜡相伴,佳肴丰盛,先订先得。这家店是一家别具特色的集装箱餐厅,室内风景也绝美,仿佛童话世界。这家店去年11月才开业,环境美丽有格调,海鲜和大连菜好吃不贵。

    • 木瓜生吃的正确吃法(木瓜生吃的正确吃法怎么吃)

      木瓜生吃的正确吃法木瓜生吃可以做成沙拉、果汁食用。做法:1、新鲜木瓜去皮。木瓜橙汁的做法材料:木瓜、橙子。

    • 电蚊香液对人有害吗(使用电蚊香液有没有危害)

      电蚊香液对人有害吗正确使用电蚊香液对人体没有危害的,但是直接接触或者食用电蚊香液是有害的。电蚊香液主要是通过加热将其中的拟除虫菊酯等成分挥发至空气中,令蚊子等昆虫神经兴奋过度后死去,一般正规的电蚊香液都会进行安全检测,其使用时挥发的拟除虫菊酯以及其他的添加成分的浓度在安全范围内才可以出厂,并不会对人体造成危害。因此一定要购买正规厂家生产的、安全的电蚊香液,并且遵从说明书来使用。

    • 百香果蜂蜜泡水的正确方法(百香果蜂蜜怎么泡水)

      百香果蜂蜜泡水的正确方法准备两个百香果和200毫升的温开水,水温不要超过60度,果子选择果皮边皱巴的甜果,不然会影响口感。百香果中含有丰富的维C和胡萝卜素,有助于增加抵抗力,起到很好的美容作用,舒缓皮肤;果肉中还有很多纤维物质和果酸,帮助调理肠道,促进消化,有很好的瘦身功能。蜂蜜本身具有调养气血,美容养颜的功效,和富含维C的百香果混合在一起,是滋补养颜的佳品。

    • 刘芸郑钧夫妻走机场(妻子的浪漫旅行6开录)

      如今,该节目终于开始录制,四组明星夫妻阵容的路透也被曝光,分别是郑钧刘芸夫妇、郑恺苗苗夫妇、陈乔恩艾伦夫妇以及陆毅鲍蕾夫妇。总体来说,郑钧刘芸夫妇应该是《妻子的浪漫旅行6》中最有话题度的夫妻,希望他们能展现给观众爱情那一面,而不是其他。陈乔恩艾伦夫妇,新婚燕尔甜蜜再升级陈乔恩和艾伦通过芒果恋综《女儿们的恋爱2》相识相恋,并于今年3月31日登记结婚,妥妥的新婚燕尔。

    • 被客户拒绝的心情说说(被客户拒绝的心情说说文案)

      被客户拒绝的心情说说人生坎坎坷坷,跌跌撞撞那是在所难免。但是,不被客户拒绝了多少次,你都要坚强地再次站起来。所有的胜利,与征服自己的胜利比起来,都是微不足道的;所有的失败,与失去自己的失败比起来,更是微不足道。人生的道路不会一帆风顺,事业的征途也充满崎岖艰险,被客户拒绝也是常事,只有奋斗,只有拼搏,才会达到成功的彼岸。人在顺境中是学不什么知识的,只有在不断遭遇拒绝困难,并尝试解决困难,人才会成长。

    • 吴京给你讲人情世故(吴京你个铁憨憨)

      吴京、段奕宏这两位“最佳损友”,相约一辈子“在一起”。面对吴京突如其来的追求,谢楠起初觉得这个男人太过轻浮。要说做吴京的儿子,生命力必须要顽强,有危险时父亲保护孩子,没危险时父亲就是危险。因为,吴京无时无刻不把儿子当成“玩伴”。吴京把对儿子的培养目标也定下来了,25岁之前,两个儿子要学会十八般武艺,包括拳击、散打、滑雪,还有赛车。

    • 保护自然保护野生动物的倡议书(是怎么写的)

      保护自然保护野生动物的倡议书尊敬的同学们。动物是人类的朋友,是地球大家庭的一员,是大自然的重要组成部分。保护发展和合理利用野生动物资源,对于维护生态平衡,改善自然环境,促进人与自然的和谐,保持生物多样性,和经济社会全面持续可协调发展有着非常重要的意义。由于错误观念的误导,人们保护野生动物的意识不强。坚决不吃野生保护动物。勇敢举报违反保护野生动物法规的行为。

    • 大雁塔与慈恩寺的区别(大慈恩寺的由来)

      由于创始者玄奘及其弟子窥基常住慈恩寺,故又称慈恩宗),此寺遂成中国大乘佛教的圣地。和宝鸡的法门寺因塔建寺相反,大雁塔是因寺建塔。大雁塔坐落在慈恩寺内,故又名"慈恩寺塔"。于是就在雁落之处,以隆重的仪式葬雁建塔,并取名雁塔。回国后,在慈恩寺译经期间,为存放从印度带回的经书佛像,于652年,在慈恩寺西院,建造了一座仿印度雁塔形式的砖塔,这座塔就叫雁塔。名称延续至今未变。