Top
诸葛亮心水论坛 > 智慧城市 > 人物 > 正文

三角兽联合创始人、CTO亓超:沉下心来做人工智能的“干货”

中国AI技术在跟其他并存的技术来说,状态还是偏好的。因为中国人在这个领域理解和这种创造力能展示出来,我们经常说是要弯道超车还是要换道超车,其实我们在这个赛道上还是走的蛮快的。
发布时间:2017-04-20 16:26        来源:赛迪网        作者:

诸葛亮心水论坛 www.actll.com


 

正值人工智能火热之时,在铺天盖地的新闻都围绕“人脸识别”和“刷脸”时,我们看到了人工智能的大脑级技术——语义识别的爆发和落地。语义识别和语音识别的一字之差到底意味着什么?将给我们的生活带来哪些变革?

今天,我们有幸邀请三角兽(北京)科技有限公司(以下简称“三角兽”)联合创始人、CTO亓超做客赛迪直播间。作为一匹成立不久就成功融资三轮的“黑马”,三角兽一直努力让语义识别服务于企业服务、硬件和、IOT和泛娱乐产业。通过访谈可以看出,三角兽进入语义识别行业并不是追赶潮流,更是为了沉下心来做“干货”,与合作伙伴共同促进技术成熟和技术的更多落地。

下文是本人对嘉宾现场采访实录的整理,欢迎各位看官读通篇!

主持人:各位赛迪网的网友们,大家下午好。今天在直播间邀请了三角兽科技的亓超,亓总。让他给大家分享一下心路历程。

首先第一个问题是比较独特的,我之前有了解过,咱们有一位创始人曾经说过,不愿意把自己定义为创业公司。我看到这个觉得蛮新奇的,想问亓总,您对此怎么理解,既然不愿意说自己是创业公司,对咱们公司的定位又该是什么?

亓超:所谓创业公司,不是大家容易接受的概念,因为毕竟是创业初期。从我们几个创始人来看,三角兽不是赶什么热潮来做某些事情,而是我们从最开始已经积累有十年的状态去做这个事情。这个事情无论是在大公司做还是在新的团队去做,本质上没有改变我们对这件事情的做法。

主持人:已经深耕这个领域很久了,用比较时髦的话说已经是老司机了。

亓超:对,老司机。

主持人:我们有了解到,您公司这边可能目前主要针对技术是语义识别技术,咱们选择物联网、智能家居领域,选择这几个领域的考虑是什么?在这几个领域营收情况能否跟大家分享一下。

亓超:好的。AI主要行业分几个大的分项。第一个是语音的部分,相当于语音识别的合成,这部分相当于人的耳朵和嘴巴,做发声和接收信息。还有一部分处理图象的信号,很多是人脸识别,图片分类,相当于人的眼睛。还有一类是做控制类型的,这些都是AI领域大家比较认可的方向。其实我们做的是语义部分,相当于人的脑子部分。图象、声音都好,他们是偏向感知这一块处理。在认知这一块是要对收集来的信号再进行合理的处理和反馈,语义这部分恰好处在大脑部分,这部分是AI非常主要的部分。

主持人:偏向于后端。

亓超:偏向于认知。

主持人:咱们现在营收和运营情况方便透露一下吗?

亓超:我们所有的客户都采用收费模式,我们现在分成两部分,第一是定制费,对于标杆用户我们可能针对它的需求定制,对合作方收取费用。

另外一部分是服务费,按照流量或者卖出去的台数去做服务的费用。目前来说,我们还算早期,在这块虽然没有达到很好的收支平衡,我们现在已经开始往这块努力了。从去年4月份开始到现在有陆陆续续7、8家客户,每家客户都会带来收入。现在状态很像我们先要跟合作方以及我们友商一块把市场攻大,才有饼可吃,才能谈更多的商业模式。我们现在努力的方面是把AI技术更多到场景中去,达到更多的可能。

主持人:刚刚您提到场景,这个也是我更想问的。在具体的场景当中加入语义识别的技术之后,在用户体验和产品性能上会有多么大的提升,这个是对于网友比较关心的,我实实在在能享受到什么。

亓超:明白,我们看AI这一块特别是语义这块技术,或是图象技术也好,更多是相当于电子技术。它其实会在各行各业,各种行业都会有它的释放和应用,在现在大家体验的相对缓慢。但是类比于当年刚发现的时候,这个技术处理已经很快了。我相信AI技术不断落地会带来更多的直观体验。比如说您平时处理一些琐碎的工作会由机器人处理。咱们其实有很多场景下已经在AI有一些释放,例如你每次去飞机场,你进行验证身份证时他需要核对您是不是本人,这已经有人脸识别辅助安检人员去做这个事情,帮助他们做优化。这可能是你直观感受到的体验。

主持人:您刚刚提到的是我们在生物领域用的比较多,另外,我是关注到咱们之前也有跟小米电视有这样的合作,把您这样的语义识别技术直接嵌入到电视里。从这个角度来讲,这个技术跟您刚刚提到的场景上有什么区别?

亓超:对于我们来说,技术都是相通的。无论是面向服务客户还是终端客户都是一样的。在小米电视我们显示的是:当摇控器已经不适合你的网络电视场景的时候,可能更希望追求自然的交互方式。例如传统摇控器顶多40多个台,现在有100个台,你要上下左右去选择。现在网络电视发展起来之后,有更多的电影、电视剧让你选择。对这样的海量信息选择,我们传统电视已经没有办法满足你的更好的交互方式。这里语音和语义交互可能会提到日常,让大家感受更方便的状态。现在更多面向的是老人和小孩儿。这种复杂的场景下,他们最自然的方式是语音。所以在这里头找到蛮合适的点,也特别感谢小米为我们提供这样的合适机会能够落地语音技术。同时在其他场景下,产量市场比较多的像手机,我们也把我们的语音技术放在锤子科技的新手机,也大大提高大家对手机操作的便捷性,这个过程也能发生化学反应。我们合作方有具体的一些需求,三角兽有更多的技术希望去对接和落地,同时在这个过程促成体验比较好的产品可以放出来,让大家在实际当中体验AI方面的便捷。

主持人:通过亓总介绍,我个人理解,今后我们在用到智能产品时说一句话,他可能就明白我的意图。我开机我只需要坐在电视机前说要开机,它就会自动打开,调到哪个台,咱们可能说中央五就会自动调到。

亓超:对。

主持人:这相当于懒人科技,大大解放了以前的人工劳动模式。

亓超:这块包括刚才您提到的控制型。我们在小米电视交互上做的更深一些,举例,当您要看英剧《神探夏洛克》,经常会被人叫成《神探夏洛特》,因为夏洛特更顺嘴或者更普遍。这时候如果不做语义理解,可能你搜出来的名字就是《夏洛特烦恼》,因为它频度也很高。当你没有办法记住片子完整名字时,我们需要给你做纠正,做更合适处理。当然同时我们会支持更多的状态,像你刚才比较明确我要看中央五,发出指令。这就好比女同志去逛街,不是为了买一件衣服,就像男孩子是有目标的。其实用户在看电视产生很大需求,我不知道我要看什么,需要你帮忙做推荐和引导,这也是智能的体现。

主持人:刚刚您有提到两个应用场景,我想问一下咱们三角兽这边未来还会拓展到哪些更多的应用场景,让更多的方便和快捷落到生活当中更多角落,这有什么考虑?

亓超:我们现在对我们的场景分成三个大的方向,第一个方向是IOT硬件相关,包括手机、家电设备像电视还有包括像车里的设备,车载系统,硬件的范畴。我们在跟很多合作伙伴一块去打造场景。第二个主要的方向是企业服务,我们会把企业分成不同的行业,因为每个行业有自己的特殊需求,我们目前在跟这么几个方向行业一起合作,像媒体行业,包括传统媒体也好或者互联网媒体,帮助大家在新闻阅读体验方面得到更好的提升。另外一个企业方面,跟金融行业打磨产品,把金融行业售前、售后客服,包括资源和信息的汇集整合在一起。对证券或者其他用户提供体验。

还有一些方面,针对我们传统的企业,例如像商场,我想知道哪些有川菜。企业方面,我们做行业的系统方案。

第三个主要方面是泛娱乐,重点打造IP形象,我们希望它有自动对话的能力。加入对话,双方可以有更好的渠道沟通,提升粉丝活跃度。包括明星,直播主播有机器人帮助它做自动对话,去得到粉丝的忠诚度。这一块想象空间也很大,我们认为在娱乐和游戏行业,其实它的市场空间和大家消费的能力现在来说是越来越强了。在AI这块也蛮好的点,我们在三个方面已经和合作方推进这个事情。

主持人:听过亓总介绍这个事情,我们第一个感觉是今后只要有屏幕、机器的地方都能实现人机交互,可能是未来这种对话将会代替我们现有的很多操作方式,可能未来真的是,我说一句话,我周围这些设备,周围终端,都能感觉到内在需求,并且提供很方便的服务。刚刚亓总讲的合作场景是正在进行时,不是将来时,是已经在做的吧?

亓超:对,我们拿已经开始做的事情举例。我想抛出一个观点,现在AI热潮很火,大家都对这块关注度非常高,促成这个事情泡沫化非常严重。三角兽做真正的干货,真正去做实打实的事情。因为很多情况下,比如去抛一些概念也好,做一个demo,要催熟AI果实,让大家享受到这个过程。

主持人:以技术驱动应用场景的落地。

亓超:对。

主持人:下面我想问一下跟三角兽目前关系比较好的这些合作伙伴都有哪些,未来该会在更多的领域去拓展哪些合作伙伴?因为我们知道人工智能这个方面不可能一家大包大揽的,都是需要合作伙伴,三角兽在这个生态上面是怎么考虑?

亓超:现在我们跟很多的无论是大的公司还是小的公司都保持非常良好的合作关系,大的公司像百度、小米、腾讯我们都已经展开合作了。对于体量没有那么大的公司,我们也开始有一些合作。像roket(音)也是创业公司,做类似于亚马逊的平台。在其他情况下,我们会更多跟场景之间距离比较近的合作伙伴去做,我们希望敞开怀抱,大家一块在做促进技术发展。我们非常open,我们愿意跟任何合作伙伴做落地事情,包括和很多京东合作伙伴也在做。我们现在的状态并不是我们去选择谁,大家一起做事情,是这样的过程。

主持人:好的,我了解。因为刚刚您在开篇的时候就有讲过,说咱们三角兽是注重语义识别技术的公司,您也说过语义识别相当于人工智能的技术大脑。所以说我想问一下,您对大脑这个理解是怎么定位的?和我们最为熟知的语音识别或者其他概念有什么区别?

亓超:语音技术相当于人的嘴巴和耳朵,它是负责把我的一些反馈翻译成语音的信号播出来,常见的产品形态像导航里。它会帮你播报导航路况,这部分处理首先是语音合成体现,但是真正规划路线是后台系统在做,这是两个不同系统在运行。在这里语义部分是把语音转化成文本之后,我们要对文本进行处理,比如你用语音方式跟机器去说“你好”,这个事儿翻译成文本之后我要对“你好”进行适合的回复,这个计算的过程是语义处理的范畴,跟语音的信号没有关系,这是对文本的处理。所以这里头是对话的两个阶段,首先从语音到文本,然后是文本的处理。反过来是文本再去合成形成声音的部分去处理,这是两个不同的阶段。

就像您的耳朵非常好使,并不代表你的脑袋聪明。很多情况下咱们说某位同学能力不是那么强,不代表他的听觉有问题,不代表他嘴巴发语有问题,只能说他处理能力没有别人强。所以在体现这块能力强弱更集中在语义方面处理。

主持人:您刚刚提大脑这个话题,因为现在很多的人工智能技术它底层需要大数据训练,需要一个深度挖掘。所以说现在这个数据就成为兵家必争之地,大家都觉得数据是一个利器或者是决胜的法宝。想问一下三角兽这边在数据获取上,是有咱们自己的平台还是咱们跟生态上的合作伙伴相互来获取这种数据?

亓超:两方面我们都会有。首先这个例子,假如说一个小孩儿,他在上学之前是围绕自己生活半径获取知识,比如简单认字,具备对话能力。上学之后会指定他学习数学、物理那是专项的东西,对那些知识来自于课本,这个状态就好比咱们的状态。对于AI语义处理基本能力,我们是采用我们自己数据的处理和运算的知识,非常大的数据量计算通过模型训练。但是具体到某一个业务领域上,专业的数据还是要依赖于合作方一起构造数据。为什么我们刚才提到有这么多场景开始铺开,我们希望我们三角兽培育的小孩,他有很多方面的知识,越来越聪明,全面的发展。

主持人:三好学生。

亓超:同时我们也会非常注重隐私的处理,比如我们现在训练聊天系统的数据完全都是从互联网可公开的数据,所有人都可见的数据去处理,不能去用很隐私的数据,这是非常危险的。我们所有数据都是大家都可以见到的数据。客户的数据也同样都是特别小心,极其保密,比如说这些数据特别的隐私,我可能选择在客户的机器或者机房做训练或部署,保证数据的安全性。

主持人:刚刚提到的数据是咱们第一个,我觉得是人工智能想要取得突破性发展,就必须有重点攻破的地方。再想让您谈一下,这个语义识别在今后发展过程当中,您觉得还有哪几方面可能需要重点攻关?

亓超:我们把语义或者其他方面比喻成这样的过程。比如家里来客人,我需要做一桌子菜。首先第一步我要去市场买菜,这一部分相当于数据部分,如果没有这些菜收集没有办法做菜,这部分很重要。

菜买回来之后就需要洗菜,数据处理就是清洗是非常重要的。第三步,我们认为工程师相当于厨师,他需要油盐酱醋的材料,也是需要学习各种工具,如果需要更高级的做菜辅助东西,像锅如果没有,菜也炒不出来。另外炒菜的人手艺也要精,比如说高压锅给你,平底锅也给你了,酱油醋都给你了,都是特别好的品牌,但是如果你不会做饭,依然炒不出味道好的菜。到第四步还有一个过程就是要装盘子,因为再好的菜也要色香味俱全包装好,这个过程到最终落到桌面上才是一个产品的落地。所以每个环节都有渴望要突破去打磨状态。 比如厨师代表研发团队的能力,工具的迭代,最早可能没有高压锅做不出好的排骨,有了以后可能做这个事情比较简单。随着技术的发展,工具化也好,每个人的能力会越来越好。前面的状态还是要有,每一步缺一不可。并不是说我只要突破了某一步,这个事情能解决。其实是一环扣一环过程。

主持人:也是想接着问一下您,刚刚正是因为您给我们详细剖析了人工智能发展的每个阶段当中会都遇到这样或那样的问题,这个技术离真正的爆发还有一段时间。这也直接导致了大家现在想起人工智能都是国外或者国际的品牌,可能对于中国的自主创新的品牌还有比较少的认知,请您大胆展望一下,什么时候当我们普通受众提起人工智能的时候,我们不再想微软小冰了,我们第一个想的是中国的某某品牌。

亓超:中国AI技术在跟其他并存的技术来说,状态还是偏好的。因为中国人在这个领域有这种创造力能展示出来,我们经常说是要弯道超车还是要换道超车,其实我们在这个赛道上还是走的蛮快的。

微软小冰背后也是这样的背景,它由中国的团队开发出来然后推到美国其他市场或者像印度、日本。这个是在微软中国历史上比较少见的状态。所以从这个层面上也能体现出来,我们说中国团队本身在这方面的创造力或者能力是很强的状态。当然这里头可能每个公司也好,每个团队也好特别擅长的领域或者方向不一样,最终我们促进这些事情发展。而且因为在中国市场,特别在互联网市场也好或者移动市场也好,有很多场景可以把AI技术落到实际技术上,相对来讲比国外更迅速更快一些。

我们希望中国这一块研发团队无论是从学术角度来说还是从产业界来说,把这个事情去做得更扎实。

我说的更扎实可能会是抛开另外一个话题,咱们中国人比较喜欢去扎堆做一些事情,这个事情AI希望大家有一个容忍度,希望大家一块去把这个事情做成。不是说找几位做更多泡沫化、概念化,需要沉下心做一些事情。所以这块相当于很多很重要的技术迭代本质的驱动力,因为现在的状况下过于火,可能会给咱们的普通用户、合作方会有更高的预期,这个预期跟实际差距大之后会让大家很容易失望,更好的状态是大家在合理的预期下,慢慢给它更好的耐心。就像咱们养小孩,刚生下来什么都不会去说,到一岁的时候简单的单词,三四岁就可以跟你对话。他有一个慢慢的成长过程,不能去催促。大家更多的是扎扎实实做一件事情,中国这块蛮有潜力。

主持人:刚刚亓总跟我们分享到,希望中国的人工智能产品沉下心来安静的去做技术,能够从干货的角度去取得更多的突破。我接下来就想说,这个背后其实是离不开相对应的市场扩张或者说咱们投融资的支持。我们也了解三角兽在这方面算是一匹黑马了,我们现在已经是有融资到三笔了,我觉得算是在资本相对火热的情况下更加突出的成绩。想问一下您,这三笔投资分别对咱们都带来了哪些方面的帮助。另外想请您谈一谈在未来我们的投资人或者是我们的合伙人的选择上还会有哪些新的拓展?

亓超:我们三角兽从去年四月份开始到现在已经拿到三笔的投资,我们刚刚结束的A轮总共三轮一共是8000万人民币,我们每一轮投资拿到之后第一件事情是扩充团队,把更多志同道合在这个方向上有抱负的同学一块加入进来做这个事情。我们第一轮投资是来自洪泰基金和天善资本的天使轮,第二轮是去年八月份君联资本和赛富基金2000万人民币的Pre-A轮投资,第三轮投资人是东方网易加上恒生电子,整个过程每一个投资人都对我们帮助特别大,积极帮我们找技术的落脚,对市场的探索、渠道,每个人都帮我们往下一阶段做努力。

像恒生电子也在帮我们一块去打造金融行业企业方案,因为有他们的数据资源,很容易让我的AI技术有落脚点。我们更希望大家在这个行业做实际事情,志同道合的,无论是投资方和合作方都有可能合作做一些实在的事情。这块我们没有特别倾向性选择投资方做事情。

主持人:也可以借助赛迪直播平台对外打个广告,希望如果有这方面比较资深或者是比较专业的投资团队也欢迎来找我们的亓总,说不定下一个独角兽可能真的就会诞生在这之中,也可能会给双方带来更多的收益。之外就像亓总刚刚畅想的中国人工智能有一天真的会走向世界,让大家提起人工智能首先就会想起中国什么什么品牌。另外我想问一下,咱们说拿到钱是第一步,您刚才说了三角兽已经拿到3轮融资,那么在资金使用、成本控制和公司运营商,三角兽是如何计划的?

亓超:每次拿到钱后,我们首先会扩充团队,招募人才。我们公司现在一半以上的人员都是工程师,技术人员,因为我们想沉下心来做实事,做干货。所以技术人才和团队是我们最看重的。

另外,对于成本控制,我们的办公区最早和其他创业团队一样,是在一间三居室的居民楼里,我们去年才搬到较大一点的写字楼里。我们之所以在创立之初没有立刻选定一个高端、豪华的办公楼,也是因为成本控制原因。我们会把所有资金用在技术人员招募和关键环节,在其他环节就会尽力节省成本。

主持人:最后,请亓总对人工智能产业的未来谈谈展望吧,未来的人工智能产业会向哪个方向发展?

亓超:人工智能产业一定是解放人力,提高人力效率的,今后一定会更加了解人类的需求,贴合用户痛点,在更多场景下为用户提供智能服务。

主持人:亓总今天的分享中,提到最多的就是“干货”一词,这也让我们此次访谈成为干货满满、诚意满满的访谈,绝不谈废话和多余的话。谢谢亓总今天来到赛迪直播间,给赛迪网广大网友分享语义识别和三角兽公司的发展历程,这都让我们深刻理解了技术和应用的现状和未来,谢谢亓总!也希望下次三角兽再有新动作或新产品时,能够再次来赛迪直播间和大家分享!

亓超:谢谢!

合作站点
stat