肥宅钓鱼网
当前位置: 首页 钓鱼百科

什么软件可以直接查单词(查单词能有多简单)

时间:2023-08-19 作者: 小编 阅读量: 1 栏目名: 钓鱼百科

但不是生物物种,而是AI带来的一个又一个新硬件、新产品和新物种。我们今天从一支笔的AI奇幻之旅说起。现在有AI,只需要拿着笔扫一下,不需要输入就能查单词。但打造这样一支AI之笔,并不容易,时也运也,赶上AI复兴,技术条件依然具备。AI大爆炸AI复兴,世人皆晓AlphaGo,另一个标志性变革鲜有人知。也是2016年,一款AI产品悄然上线,不同于AlphaGo带来的冲击,但它让每一个人都能真正体验到AI的能力、实力和便利。

乾明 发自 凹非寺

量子位 报道 | 公众号 QbitAI

你知道地球上物种大爆发的时代吗?

现在就很像。

但不是生物物种,而是AI带来的一个又一个新硬件、新产品和新物种。

一切正在被重新定义,小到一支笔,大到一家公司,再大到整个行业。

我们今天从一支笔的AI奇幻之旅说起。

一支笔,AI加持

碰到不认识的英文单词,你会怎么办?

掏出来电子词典?打开手机上的App查?还是搬出“牛津词典”?

现在有AI,只需要拿着笔扫一下,不需要输入就能查单词。

整个过程,只用了大概1秒钟的时间,要比翻纸质词典,用电子词典以及手机快多了。

而且, 再长也能扫出来,比如这个单词:

supercalifragilisticexpiadocious。

出现在一部名叫Mary Poppins的电影里,意思是“好”。

翻译的质量上也有保证,还能自动把单词念出来,让人感受发音。整个过程,不需要联网也能完成。

还能翻译一句话:

这支笔,是网易有道新推出的AI硬件网易有道词典笔2.0

在8月底,将会OTA升级,在目前离线查单词和整句翻译的基础上,推出整段翻译的功能。

但打造这样一支AI之笔,并不容易,时也运也,赶上AI复兴,技术条件依然具备。

AI大爆炸

AI复兴,世人皆晓AlphaGo,另一个标志性变革鲜有人知。

也是2016年,一款AI产品悄然上线,不同于AlphaGo带来的冲击,但它让每一个人都能真正体验到AI的能力、实力和便利。

它就是首个基于神经网络翻译的机器翻译系统问世。

不同于基于统计的传统机器翻译方法,神经网络机器翻译能够自动从语料库中学习翻译知识,从而实现了翻译质量的”跨越式“发展。之后神经网络机器翻译便成为主流翻译工具的核心方法,融入了人们生活之中。

不过,这只是前奏。

整个AI技术方向上,计算机视觉、语音识别、自然语言处理、机器人等等都有了惊人突破,机器已经在图像识别、语音识别等多个方面超越普通人类水平。

与此同时,掌握成熟AI技术的公司,开始思考怎样把AI进一步落地,实现其商业价值。

而教育领域,网易有道借势而起,结合已有场景,加持前沿技术,打造全新硬件产品,最后解决实际难题……

网易有道词典笔2.0,正是其中缩影。

它主打的功能,是每秒查一个单词:

与”传统的”查单词方法相比,核心原因是省略了人”输入“单词给机器的过程,而且由机器将单词输入给机器。

具体来说,它的笔头是一个高速摄像头,核心作用是在用户提笔扫单词的时候,每秒拍摄100多张图像。

这图像……太碎了,对于机器来说,根本不可能理解,更遑论翻译?

要用AI把它们拼起来再给机器看,整个拼接过程难点不少,并不是任何一家公司都能够驾驭。

首先,文本图像的拼接问题

与正常处理的图像不同,使用高速摄像头拍摄下来文本图像纹理特征通常较少。

通常用于完成拼图任务的基于尺度不变特征匹配方法,很容易对不同的文字图像生成相同的特征描述子,从而引发误匹配导致拼图失败。

为了解决这个问题,网易有道根据实际应用场景自行设计了一套特征,从而用自定义的方式快速提取特征。相比传统SIFT花1毫秒提取单张图像的特征,有道定制化的提取方法要高效很多。

总体而言,词典笔2.0所采用的图像拼接方法可以分为图像配准、图像融合与文本切行三大步骤。

此外,他们也对算法上进行了很多优化,比如文字的加测、样本的矫正等等,进一步提升扫描图像的拼接准确度。

其次,用户扫描不规范的问题

这支笔,是一个面向C端用户的产品,使用者是有各种习惯的用户,他们扫描的过程中持笔的角度、滑动的速度以及抖动都会影响图像匹配。如果使用传统的图像特征匹配方法,很容易造成误匹配和高延时。

网易有道介绍称,他们设计的多特征图像匹配算法,能够充分挖掘上述场景的图像对亲关系,从而支持最高240mm/s的扫描速度,与桌面夹角成90度至60度的扫描角度,拼图成功率高达98%。

此外,他们通过综合所有字符检测位置对用户扫描的行样本进行组行、矫正、切分,来解决用户持笔扫描抖动的问题,也支持一定距离内的左右滑动。

至于不同扫描文本的字体不同、背景不同等问题,他们也在模型训练过程中扩充上述场景的素材,极大地增强了模型的泛化能力,也在拼图阶段使用图像处理方法对全景图像进行了去燥使得文本特征更加突出。

除了上述的自适应全场景拼接功能,他们还实现了流式识别计算——即在扫描拼接图像的同时,将内容提取出来,交由神经网络去翻译。

通过种种优化,网易有道最后实现了95.5%的综合准确率,而业内平均水平不过82%。他们表示,这一成绩超越了竞品。

网易有道凭什么?

网易有道归去来

有道,一开始是一款搜索产品,定位是网易自主研发的中文搜索引擎。

在搜索领域7年的耕耘,为其在大规模数据存储计算等领域留下不少技术储备。

2013年,有道选择将精力从搜索业务上收回,专注于语言翻译应用与服务、个人云应用和电子商务导购服务等三个方向。

最核心的,是语言翻译应用与服务方向的业务。

2006年12月,在搜索业务上线的同时,网易有道也推出了海量词典产品,而且一直在有更新推进:

2007年12月,有道词典桌面版正式上线,2009年1月,有道词典首个手机版本上线。

10多年发展至今,网易有道词典已经官宣有8亿 用户,成为国内最大词典应用之一,这样也给网易有道的技术研发积累了大量数据。

在发展过程中,网易有道也在不断拓宽业务边界,推出有道云笔记、有道精品课等一系列产品,涉足在线教育市场。

虽然网易有道没有抓住搜索的浪潮,但在神经网络重塑整个行业的时候,它抓住了,并在光学字符识别技术和神经网络翻译方面,建立了优势,这也是在线教育领域最为核心的两大AI技术。

2016年,谷歌上线神经网络机器翻译系统的那年,网易有道首席科学家段亦涛开始带队研发神经网络翻译技术,并在2017年将有道翻译升级为神经网络机器翻译引擎。

现在,有道神经网络机器翻译系统,支持中文与英日韩等12个语种直接互译,9种语言的英文互译。

在准确度上,也达到了业内领先的水平。

根据网易有道披露的数据,2019年7月的测评中,网易有道的神经网络翻译引擎在大小写不敏感的情况下,新闻领域测试集上的BLEU-4得分已经超过谷歌和微软。

2017年,网易有道也开始使用基于神经网络的OCR技术,在互联网教育行业中持续进行技术渗透和迭代更新。

网易有道宣称,现在,其已支持26种语言文字识别,也能进行语种自动判别和混合识别,准确率达99.6%,是目前国内识别语言最多的OCR识别引擎。

除了常规识别场景,针对教育场景,他们还对OCR技术进行了优化,比如公式识别:

准确率达到93%,可以实现转LaTeX功能,并在此基础上研发出了机器自动解方程功能。

此外,还支持拼音、绘本、模糊字等特殊文本的识别,平均准确率达95%。而且,在提供线上服务的同时,有道OCR引擎还支持端侧的离线模型部署,大小为50M。

在语音识别与合成与自适应学习的技术研发上,网易有道也已投入大量资源进行研发工作。

其中,语音识别技术在一些场景上准确率超过98%,支持中、英、日、韩多个语言,语音合成引擎也已经支持中、英、日、韩、葡等多个语言。

自适应学习方面,已经能够配合智能硬件,实现实时采集书写数据,提供学情分析、知识图谱评估等一系列自适应学习辅助功能。

这些技术积累,正是网易有道“站出来”、拿出解决方案的原因。

从2017年开始,网易有道也开始推动AI技术落地。一方面通过有道智云,向企业用户输出能力,合作伙伴有华为、小米、OPPO、联想、努比亚、步步高、优学派、读书郎等。

另一方面,也开始寻找场景,面向消费者推出AI硬件。从2017年10月推出翻译蛋以来,已经有8款产品问世。

现在,网易有道是一家什么公司?CEO周枫说,是一家全链条的教育科技公司。接下来要做的是探讨“教育与科技的结合”。

这是整个行业的大势所趋,也是网易有道的机会。

因为变革时代已来,新技术催化,硬件新物种频出。网易有道这样的公司,也会越来越多从“幕后”来到台前。

在AI浪潮中,你还能举出类似的公司吗?

— 完 —

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

    推荐阅读
  • 三门峡属于哪个省(三门峡的简介)

    三门峡属于哪个省三门峡,河南省辖地级市,位于豫晋陕三省交界黄河南金三角地区,地貌以山地、丘陵和黄土塬为主,属于暖温带大陆性季风型半干旱气候;总面积10496平方千米,辖2个区、2个县、代管2个县级市,2019年常住人口227.65万人。2019年,三门峡市全年生产总值1443.82亿元,按可比价格计算,比上年增长7.5%。其中:第一产业增加值136.18亿元,增长3.8%;第二产业增加值704.88亿元,增长8.5%;第三产业增加值602.76亿元,增长7.0%。

  • win10系统重置卡在88%怎么办 解决办法分享

    如果我们在使用win10系统的时候需要对系统进行重置的话,如果出现了win10系统重置卡在88%不知道应该怎么解决的话,小编觉得可能是因为我们的系统后台还在加载,可以尝试耐心等待一下,或者是排除一下是不是我们的网络出现了问题导致文件无法加载。

  • 中元节的来历和风俗的故事(中元节的来历和风俗的故事是什么)

    中元节的来历和风俗的故事来历中元节由上古时代“七月半”农作丰收秋尝祭祖演变而来,七月半是民间初秋庆贺丰收、酬谢大地的节日,有若干农作物成熟,民间按例要祀祖,用新米等祭供,向祖先报告秋成,是追怀先人的一种文化传统节日,其文化核心是敬祖尽孝。所以人们纷纷在七月里以诵经作法等事举行“普度”以普遍超度孤魂,恐防它们为祸人间,又或祈求鬼魂帮助治病和保佑家宅平安。因此南方地区在这一天有普度的习俗。

  • excel显示不出来身份证数字(Excel中关于身份证的十条黄金用法)

    Excel中关于身份证的十条黄金用法身份证相关处理方法,是每一位数据处理者都会遇到的问题韩老师总结了EXCEL中,关于身份证必须要会的十条知识,你都会吗?如下:1、身份证输入18位身份证号码的正确输入方式:一种方式是把单元格格式设置成文。

  • 羊羔毛可以漂白吗(羊羔毛可以漂白吗怎么漂白)

    漂白之后就会被损坏,漂白水适用于纯白色的棉、麻、涤材质的织物,不可用于彩色织物,不可用于丝绸、毛、尼龙、皮革衣物,否则会损坏衣物。羊羔毛属于动物毛类,为动物蛋白质纤维,易缩水,所以一般宜送到专业洗涤店干洗。

  • 宝宝眼睛进了东西怎么办(宝宝眼睛里进了东西怎么办)

    因为异物在眼里经过揉挤就可能损伤脆弱而灵敏的角膜,造成角膜溃疡、感染,影响视力。提起眼皮轻吹一般异物如灰沙、睫毛、蚊虫等进入眼内,多数是黏附在眼球表面。及时入院如果异物嵌在角膜上,切勿用尖硬物进行随意挑拔,以免致角膜穿透;应速送医院治疗。由于家长很难自行判断异物是否已经取出、或对眼睛有无伤害,因此建议无论异物取出与否,都立刻带宝宝到医院做进一步检查。

  • 美度指挥官和舵手用的机芯相比较(美度指挥官和舵手怎么选)

    美度指挥官和舵手用的机芯相比较美度手表在瑞士排名如何?Mido美度手表的制表哲学是永恒的设计和实用功能的结合,而不是顺应潮流。新款美度舵手,搭载天文台精磨硅游丝新款机芯,在颜值上,也相当漂亮,美度舵手系列是十分年轻而鲜活的,在性能上已相当不错,它又是美度历史上以实用著称的产品。它具有完美的防水,防磁和防震能力,是美度表历史中的一个重要的里程。美度舵手系列70多年来,舵手系列始终是尽善尽美,经典永存的标志。

  • 常山在哪里(常山在哪里个省哪个县)

    2、东汉建安二十三年建县,始称定阳;唐朝咸亨五年,分信安在原定阳县地置常山县,以县治南有常山命名,以常山县为名自此始;常山县矿产资源丰富,已发现的矿产资源有38个品种,其中石灰石、石煤、莹石矿储量和品位均居浙江省首位。

  • 红枣和苦瓜片泡水喝有什么好处(红枣和苦瓜片泡水喝有啥好处)

    红枣和苦瓜片泡水喝有什么好处枣中丰富的维生素C,使体内多余的胆固醇转变为胆汁酸,胆固醇少了,结石形成的概率也就随之减少。枣中富含钙和铁,它们对防治骨质疏松、产后贫血有重要作用。苦瓜具有清热消暑、养血益气、补肾健脾、滋肝明目的功效,对治疗痢疾、疮肿、中暑发热、痱子过多、结膜炎等病有一定的功效。苦瓜具有预防坏血病、保护细胞膜、防止动脉粥样硬化、提高机体应激能力、保护心脏等作用。

  • 汽车vin码使用原则(你知道什么是汽车的VIN码和OBD接口吗)

    今天来给大家介绍一下车辆的VIN码和OBD接口。所以各位车友如果有打算购买一辆二手车,那么就可以通过我们的二手车的VIN码去来判断这辆汽车的生产年份,以便于我们对于这辆车的一个整体的概况有一个简单的判断。实际上通常来讲,OBD接口是在于我们方向盘下方的内饰板内,而且靠近我们驾驶员的膝盖。OBD2代系统与之前的车载智能的系统不同之处就在于它有严格的排放针对性。而2004年产生的OBD第三代可以说是一个更为先进的开放系统。