扫一扫,关注和君咨询,共同分享有建设性价值的商业思索、见闻和感悟

公司总机:010-84108866

业务咨询:400-610-3699

文化旅游产业研究中心

思想观点

【和君文旅·旅游产业】TIC沙龙第六期:分音塔关磊谈翻译机

 

 

2017-08-27 关磊 

大家好,本质上我不属于旅游行业,我是今年进入旅游行业,我介绍一下我自己,我是毕业以后做通信行业出身的,后来创业做了一家公司,和你们很像也是2015年挂了三板,之后出来又做了一家公司,现在做了一家公司去年刚刚成立,这个项目2015年底运作,我们通过人工智能技术实现跨语言的沟通,今天是论坛性质的,我讲一下我对人工智能技术的认知,对旅游行业自己的一些思考,我对旅游行业不太熟悉,今天也是抱着学习态度跟大家交流。

    刚才其实很多人谈到了人工智能和大数据,包括张总也是搞得人工智能出身的,很高兴在这个场合有一些交流。人工智能大家近两年听得比较多,其实它的发展很多年了,从一九六几年,全世界第一次人工智能大会在美国举行,发展历史已经六七十年了,为什么大家听得比较多,因为2012年2013年深度学习算法突破,导致了很多技术突飞猛进的发展,现在看起来人工智能技术必须基于互联网之后才能产生,它最主要的技术第一是云计算、第二算法的突破,第三大量自动化数据的获得,在互联网和移动互联网时代出来之前,这种大量的自动化数据不可能产生的,移动互联网发展这么多年,大量数据成几何倍数的增长,导致了人工智能技术发展在最近几年获得一些突破。这个技术发展理论界有很多不同的称职,很多科学界持悲观态度比较多,我们毕竟不是科学界和理论界,我们不做探讨,但是我还是比较喜欢马云做的总结,非常浅显易懂。过去的20年我们实际上把人变成了机器一样,大家大量的去运算,大量去工作,大量去分析,接下来20年是把机器变成人的时代,需要记忆的事情,或者需要计算的事情,简单重复的事情,计算机比我们厉害得多,我们可以把大量时间和自己智慧更多用于创新的事情,而且传统的像我们小时候背乘法表、背很多公式,背很多单词,这些记忆的事情,做大量运算的事情更多交给机器,这方面它们会比我们越来越强。

    未来十年,我觉得是人工智能大发展的一个时代,其实无论你身处在任何行业,我觉得都有必要去了解它,就像互联网一样。现在很少说有一个企业说我们没有用互联网,你即使不是互联网企业,你一定会使用互联网的工具,比如说互联网的营销、客服、数据分析,你一定会跟互联网或多或少的结合。未来越来越公司发展都会或多或少跟互联网结合起来,你越结合的快,你这方面发展的速度越快,你有更好的竞争优势。有几个领域可以跟大家探讨,刚才张总谈到做客服,我觉得未来三到五年80%的客服会被机器客服替代掉,简单重复的脑力工作,产生大量输入输出的领域被替代掉,机器翻译未来五到八年也会有突破,比如说保安等等,这些领域都是未来五到十年重点发展领域,因为它存在大量的数据,而且它存在大量重复的工作,创新性的工作比较少。

    这点我也讲一下未来的场景,比如说我身边很多朋友做人工智能的创业,比如说我们现在最痛点,我是从县城出来的,前年我父亲得一个重病,在老家三甲医院被误诊了,误诊以后很麻烦,来北京去协和来看,一模一样的片子,协和医院医生得到的结论跟你省城和县城医生得到的结论完全不一样,它的数据一样,但是它的分析不一样,未来人工智能发展跟医疗结合,比如说把协和医院和一些医院诊断结果进行训练,把训练以后的算法和产品提供给当地的医院,可能五年以后我们县城一个小医院拍一张片子,这些医生诊断水平基于AI技术,这些医生诊断水平可以达到北京医院一般医生的诊断水平。

    还有教育,教育方面资源集中在北上广深,我们通过AI技术引进,用AI技术去支持一些普通老师的教学,在县城里面,在当地四线五线城市里面你可以受到更好的教育,通过技术发展弥补教师能力的缺失。比如说这两年推出很多小额信贷,你网上申请,针对三四线城市,资本上最快七分钟放贷,背后也是AI,他们得到你很多金融、信用卡数据,把你名字输入进去,后面通过计算机一分析,五分钟七分钟就可以给你放贷,几千块钱也不多,这就是AI技术发展的信贷行业便利性。

    人工智能分成几个大的领域,从最肤浅的来说就是感知技术,人的五官,我突破用计算机看到、听到、触摸得掉,延伸的视觉技术、语音技术、指纹识别、人脸识别,首先感官方面解决这个问题。感知技术发展,基于这些东西做分析,叫做认知技术。这里面比如说通过语音转换成文字,一会儿我们在前门后门下车,其实这句话我们人能听懂的,这个翻译成文字用计算机理解就涉及到NRP,机器翻译被称为人工智能皇冠上的明珠,你必须理解这句话才能翻译的很准确。打个比方“中国乒乓球队谁也打不赢”,“中国足球队谁也打不赢”,这两句话实际上意思是相反的,这背后存在知识图谱,你把知识图谱覆盖掉以后,你深刻理解这句话的意思,你才能把它翻译的准确,相对起来认知方面比感知方面的技术更加难一些,这两年随着机器翻译和NRP这方面很多的新型工具在产生,这方面有很大的发展前景。在感知和认知的基础上我们在做决策。比如说无人驾驶,为什么无人驾驶比较难,实际上它涉及到多样技术,我还要感知到认知到,然后去做分析判断,前面有一个人我该怎么办?这么有一个人,这边有两个人我该怎么办,所以它涉及到决策方面的东西,所以人工智能大概分这么几个层次。

    我个人非常的认可一个看法,通过人工智能技术发展其实未来有三个领域会有很大的作为。

     第一就是无人经济,比如说前一段时间马云推出来无人便利店,这个以前不好实现,随着人工智能的技术发展,随着传感器的发展,自动化程度会非常高,对你人的判断,包括人脸识别、手势识别、身份识别等等一系列的技术提升,可以对你人做一个精确的判断。判断之后,我对你支付宝的信用数据、银行数据分析就知道,和你所有信用相关联,你发生违约行为,发生拿一包方便面不给钱的行为,你可能在所有银行都贷不了款,所以通过这种方式,未来几年无人经济可能会发展非常快,很有私密性、成本非常低、非常便利,就像我刚才举贷款的例子,同时有一亿人在贷款的时候,后面就是几台机器给你服务,而不是人为你服务,所以它非常快,审核一个贷款有一家公司做了7分钟,这个网上一刷单,没钱了,一填我贷款五千块钱,7分钟给你放贷,非常快。

    第二个共享经济,今年非常火,不再多说了,我觉得未来一定是使用权比拥有权更加重要,因为拥有东西成本非常高,尤其是在我们这种快速发展快速迭代的过程中,很多东西快速发展和迭代的,所以拥有东西成本会越来越高。比如说我有手机,花七千块钱买一个iphone8、iphone10,可能用了一年,第二年我就换了,我拥有什么东西,比如说我有一个好的相机,我一年用几次,这个成本非常高的,共享经济越来越把这个成本降低下来。

    第三个娱乐经济,这个对我们来说是一个利好。人工智能发展会让两极分化越来越严重。比如说无人驾驶,在北京我们可能每个人用于交通的时间,自己开车,可能每天有三到四个小时,无人驾驶出现的时候,这三到四个小时把人解放掉了,你不用开车了。这时候有一波人在车上学习处理工作,大部分人在车上去看片、玩游戏,所以就把这个时间效率提升以后,造成了这两极分化越来越严重,小时候老师要你们好好学习,你们不好好学习,未来十年你没有钱买机器人,会越来越落后。

    简单介绍一下我们公司,我们公司去年才成立,我们就做一件事情,通过人工智能技术实现不同国家和不同民族的跨语言的沟通和交流,我们希望能够在未来十年时间之内,让不同国家跟人类交流沟通没有障碍,一旦沟通没有障碍之后,我觉得无论是教育、贸易、旅游、文化、政治、经济都会发生很深远的影响,因为人和人的隔阂,最主要由于语言不通造成了文化和信任等一系列的问题,当语言通了以后,一连串的东西可能随之发生很大变化,这个也是我对这个事情非常感兴趣的一点。

    人工智能翻译机是非常全新的品类,国内我们和科大讯飞在做,美国和日本也有一些公司做这方面的事情,有些人知道有些人不知道,我放一小段视频。这是很新的东西,目前科大讯飞做了一款,大概今年四月份上市,现在已经卖了八万多台,收入年终报表做到了1.8亿的收入,我们上市晚一点,我们7月份上市,6月份我们做一轮众筹,第一批一万台已经出货,日本有一家公司做一款,明年东京冬奥会在日本召开,他们是合作伙伴,日本所有的机场、酒店计划这两年全部铺上,到日本来的每一位游客能使用上。还有一些公司也在做这方面的研究。

    这是目前行业里面的相应研究和发展,通过这种方式你可以在任何场景下和外方进行一些很自然的沟通和交通,有些语种,比如说拉丁语之间的互译,中文对英文的互译这种会发展比较快。

    我们要做得是跨语言的沟通,跨语言沟通各个场景都需要,无论是B端还是C端,在社交,这里面很多是软的场景,比如说微信平台,直播,我们和一些直播公司合作,他们用我们的API,他们做噱头,找一些美国人和土耳其人在他们本国做直播,但是受众是中国人,有字幕中国人看得明白,通过这种方式做跨国的贸易和交流。比如说英语学习,我坚定认为10年以内绝对不需要英语了,科技本质是让人变得越来越懒,因为懒惰是人的本性,我能玩,我为什么一定要做一些数学题,科学发展实际上让人变得越来越懒,能够让工具解决的,涉及到运算、记忆、重复性的工作和劳动,工具能解决,人一定不需要去做。我觉得人只要学好他的母语之后就可以了,当然有20%的涉及到外交、涉及到外国文学等一些专业场景还需要人的语言交流,其他就可以通过工具可以进行交流。

    包括视频会议,去年中石油、中石化找到我们,他们有大量海外的视频会议,能不能植入API跟对方进行交流,中石油在沙河环保研究院有十几个会议室,每年的同声传译的费用就一千万。

    我自己预测在未来的五年能够实现主要语种间的翻译,现在拉丁语系之间的互译做得非常准,谷歌做得也非常棒。但是基于汉语为中心的翻译现在普遍做得比较差,未来五年汉语翻译,像中英、中日、中韩、中德、中新,这些大语种我觉得会做得非常棒。

    我个人是做营销出身的,人性始终不会变的,人是需要个性化、自由,这是一个人始终需要的地方,我无论做任何事情我需要指导权在我手上,我能够选择。在旅游行业过去15年是互联网的时代,互联网本质上是信息革命,通过信息对称改变了很多服务,包括把价格降低,可以远程提供服务,把交易模式都进行了重塑,实际上一步一步把主导权、选择权从商家一步一步挪到用户手上。我第一次来北京旅游的时候,报个团 ,早上几点钟起床、几点钟吃饭,吃完饭坐大巴,到什么景区,玩多长时间,说好一个小时,一个小时必须出来,出来以后就去购物店,你买不买,反正一个小时在那待儿着,你不买的话,反正门一关你进不去,买东西少导游给你脸色看,吃饭的时候中间挨宰。这是15年前、20年前的旅游场景。

    我们现在场景完全发生变化了,比如说我去年去西藏,去之前我在蚂蜂窝上做旅游攻略,提前在携程上买了机票到成都,在去哪儿上订了酒店,比较便宜。第二天一大早在神州租车,租一辆SUV就进藏了。沿途过程当中你可以做选择,你想住得舒服一点可以订酒店,你对民宿感兴趣可以晚上住在藏民家里面,晚上一块喝酒唱歌。你可以住青年旅社里面,和驴友第二天一块去爬雪山等等,所有选择都在你手上,这些问题基于互联网发展这15年,国内自由行的比例已经到了96%以上,大部分是自由行或者半自由行。

    那么问题来了,我消费是一样的,我在很多网站上也能查到国外这些景区的东西,我可以在网上订到去法兰克福的机票,订到卢森堡的住宿,签证我也可以解决,随着经济发展我比以前更加有钱了,以前由于资金限制,现在我有钱了,经过互联网发展所有东西便宜起来了,但是我还是不能很好的出国自由行,我出国自由行东南亚可以,日本可以,去欧洲我还是很吃力的,因为我英语不太好,欧洲人说英语很多也不太好,去欧洲我还是得跟团玩。我弟弟上周第一次带着一家三口去泰国,回来抱怨一大堆,他英语不太好,第一次去泰国旅行,当地导游安排一个点一个点跟国内15年前旅游一样,去海边安排一个小时,海边游泳一个小时催你上来,沿途让你坐游艇、帆船,全部是收费项目,你坐你就坐,你不坐就在岸边看他们坐,他说后悔了,早知道带着我翻译器直飞普吉岛就可以了。所以未来出国场景下签证问题、经济问题,还有一些其他问题,都不是问题,核心问题在语言,只要你会语言你安全感建立起来了,你可以和别人交流,沟通和交流是安全感最基本的东西,你和别人不能交流的时候,你信任关系安全感不会建立起来,很多还是恐惧的心态,我们通过语言的沟通解决问题,可以把恐惧心态消除掉,可以跟别人做很多的事情。

    所以我们接下来的主要的障碍,我们认为未来几年主要在沟通障碍,我们一定要解决掉。

    未来十年我们通过一个语种一个语种做,中英我们做得非常棒,中日我们做得非常棒,下半年重点在做中泰,一个语种一个语种做,让这些出国旅游的人到海外可以跟对方很好的沟通。我相信通过这种沟通的建立一定能够改变很多旅游的格局。

    ToC这块,如果语言可以建立,我出国一般住Aribnb,我喜欢本地人做一些交流,以前我们叫旅游,现在更多说白了是一种生活模式的变化,我出去以后,因为中国人好奇心比较强,我希望对当地的文化、当地的宗教、当地的建筑、当地的历史,和当地人有一些互动和交流,这种互动和交流在以前你很难建立起来。我发现出国同样是玩,一个英语好的人和一个英语不好的人,同样去美国,我玩完景点就回去了,他游完景点就去当地的酒店跟当地人聊天,交一群朋友,我好像格格不入那种感觉。

    ToB也是一个很好的场景,你发现通过ToB场景,你发现比如说我们现在和一个省还在谈,一个省整体的旅游局在合作,这个省以前靠能源和旅游双产业,能源这块弱以后,旅游这块发展。需要把整个高铁站所有服务人员配这个设备,景区也配这个设备,这样所有老外从坐高铁到坐大巴到景区都可以自由的住宿。以前比如说我们老外跑到千岛湖或者云南腾冲,当地的民宿,当地的景区,当地交通无法支撑这种服务,但是通过这种工具,实际上它能够提供这种服务,让更多老外过去,这是取决于语言的跨界。

    这是我们一个设想,这是我一直想接下来几年一直想尝试的东西,因为这里面的东西是我们在做的,我们核心做机器翻译,语音识别和语音合成,我们和一家公司合作,这块是我们翻译的内核云平台,我们一直想做一个出国版的亚马逊ECHO,我们觉得互联网发展变得越来越重,现在很多页面到四级五级六级,你找到一个信息很难,包括你出国旅游需要找上千个APP,到底哪个APP好,这个甄别也很难。我们大家都在抢占语音的入口,大家有没有用一些互联网的电视,比如说像海尔、小米正在做电视遥控器就是语音的摇控器,我想看《战狼2》我直接跟它说了,就给你播放了,跳到34分钟,然后就跳到34分钟了,停止就给你停止了,全部语音交互,不像以前一样翻页翻页找找输入,语音这种方式和互联网结合以后,所有语音就是一级,大家为什么做语音的入口就是这个原因,通过语音交互我们可以查天气、可以订机票、可以订住宿、可以叫车,说一句话就可以了,不像以前我打开APP,滴滴打车,派车,到哪到哪;查天气,打开墨迹天气然后再查哪个城市;我要订机票,打开另外一个APP,所有东西都很繁杂,以后我对我设备说一个语音就可以解决掉,这是一步一步的做的,中国信誉体系建设这方面发展速度反而比美国慢一些。

    我们想通过跨语言沟通这种工具化的需求,切入旅行者的行踪服务,携程都在做G+9,我明天飞到曼谷,两天以后飞到普吉岛,五天以后从普吉岛回到了北京,这个过程中到底发生了什么,大家做监控的东西,我们方法也有不一样的地方,我用这个东西,我在出国场景下我和当地人在交流,无论是用车也好,无论是点菜、酒店也好、玩也好、聊天也好,跟当地人都在交流,交流过程当中自然而然就是一个语言入口,我很容易从后台通过人工智能的技术分析你的意图,因为你在交谈,交谈意图是什么?我很容易分析到。我分析到你的意图我给你做相应行踪服务。在泰国我就使用这个东西我叫一辆车,我需要一辆出租车,连接到当地的出租车公司,你语言自动翻译成泰语给当地出租车发一个指令,五分钟以后这个出租车到你这了,这个很便利。我想订一个酒店,明天报一个团潜水,相应给你做好翻译,跟当地一些公司做好连接,行动的时候,为你提供服务就是语音的一级,你跟它说一个指令就可以了,这种服务非常方便了。大家习惯使用很多APP你找到信息比较简单的。但是出国场景下,因为是低频次的消费,很多APP找不到,或者找到很麻烦。所以出国情况下这种语音行踪服务比国内更好,我们通过跨语言沟通这种工具,能不能给用户未来提供更多的服务,这是我们整体的设想,我们需要一步一步的落地,我们认为这一步一步的可以实现的。

    翻译机,我们做以汉语为中心旅游场景下口语沟通翻译,这和很多泛场景的翻译,和书面翻译不一样。所以评测过以后你们都很清楚,我们在旅游场景下,汉语的翻译有些语种做得最棒的,其他语种我们不敢保证。人工智能翻译机是用人工智能技术支持实现你实时的翻译沟通,根据你使用习惯,未来比如说方言,东北人、河南人、粤语,每个人使用习惯不一样,有一些人除了方言之外还有一些口头禅,这些口头禅对你所有识别和翻译都是干扰,做口语需要把这些口语都移化掉,这句话我想想该怎么说,这个表意需要翻译出来,这个口头禅要去掉,你翻译出来会出现问题。根据口语,根据每个人使用者的习惯做个性化的优化和推送,这是需要一步一步来做的,目前更多是人辅助于机器,我们觉得五年以后慢慢是机器配合人。

    我们第一批销售了一万台,回访做了两千份问卷,发现其中旅游场景占88%,在北上广有一些日常的沟通场景,用得语种最多是英语、其次是日语,中国去的最多是泰国其次是日本,再次是美国一些欧洲国家。

    现在市场国内最主要我们跟科大讯飞做,科大讯飞最早想投资我们,我们没有让它投,后来变成了一个竞争对手,我们前几天找了雷锋科技做评测,评测结果刚刚出来,我还是有点小兴奋,评测报告显示,讯飞中对英翻译的准确率,旅游日常口语达到96%,我们是94%,英对中我们是94%,他们是92%。科大讯飞没有日语,我们中对日翻译达到92%,日对中达到90%,比中文差,要重点做优化,前提条件是旅游日常,你做学术性的会议、化工、石油,这种特别专业的词语还是不行的。大概分享这么多,我希望跟大家交流成为朋友,向大家学习,谢谢大家!