研发技术

科大讯飞 硬件工程师 科大讯飞副总裁王玮:AI大模型与智能SaaS应用正加速赋能千行百业|2024 ITValue Summit 数字价值年会

小编 2024-11-24 研发技术 23 3

科大讯飞副总裁王玮:AI大模型与智能SaaS应用正加速赋能千行百业|2024 ITValue Summit 数字价值年会

科大讯飞副总裁,听见科技总经理 王玮

9月11日-14日,由钛媒体与ITValue共同主办的2024 ITValue Summit 数字价值年会在三亚举行。会议由钛媒体集团、ITValue联合主办,此次峰会主题为“Ready For AI”,交流经验教训,交叉行业思考,推动创新交易,以创新场景为基础,共同探索AI驱动下数字经济时代的全新机遇,共同打造一场数字经济时代的AI创新探索盛宴。

大会首日,科大讯飞副总裁、听见科技总经理王玮以“AI+SaaS,开启智慧办公新生态”为主题发表演讲。

王玮表示,AI 大模型正与每个人息息相关。不管是医疗、会议,还是物流等领域,以大模型为核心的生成式 AI 技术正在帮助人们提质增效。从语言到认知,讯飞听见是办公场合的应用利器,目前讯飞听见在智能语音转写工具领域排行第一。

“我们希望,讯飞听见能够成为你随身的语音记录助手,不仅能够记录,而且还能把文字进行提炼,帮你归纳整理做待办。”王玮指出,大模型技术促使SaaS智慧办公服务实现更多的落地商业应用。

据悉,讯飞智慧办公SaaS平台,是科大讯飞推出的智慧办公综合网站。以SaaS办公产品为核心,融合科大讯飞旗下多款智能硬件,为用户提供全面、便捷、智能的AI办公产品及服务。核心的SaaS产品主要包含讯飞听见、讯飞同传、讯飞写作、讯飞会议,基于AI能力帮助用户从记录、沟通、创作、协同工作流中提效,创造新质生产力。

2010年,随着讯飞语音输入法验证了讯飞专攻的语音技术的市场规模以及商业化价值,讯飞在商业化产品探索中,决定开启做为技术付费的产品,商业模式当下最适配以及市场校验最快的赛道就是SaaS。

2015年,科大讯飞上线讯飞听见转写网站,并正式对外发布正式版讯飞听见产品家族,依靠19.8元/小时的转写服务,网站上线半年后获得100万用户。成为中国SaaS产品市场上最早的一批付费工具产品,并且一路发展到今天成为中国智能语音转写领域第一。讯飞同期还发布首款录音笔。

讯飞智慧办公SaaS 平台是讯飞战略发展中的重要一环。截至目前,讯飞智慧办公SaaS平台报告期内生态用户超过2亿,覆盖用户超过7500万,2024年平台升级后聚合讯飞旗下多款智慧办公硬软件产品,用户可实现讯飞办公产品的一站式选择和使用,随星火大模型能力搭载后,讯飞写作新增付费用户数超1240%,平台整体付费用户数超20%,并与中国电信、中国工商银行等企业达成合作,助力千行百业 AI 提效。

同时,讯飞听见层面,目前是智能语音转写第一品牌、手机应用商城效率转写排行第一,也是业内最早起家做智能语音转写和付费SaaS的产品;讯飞同传层面,其已经为数十家世界500强企业持续提供AI同传服务。公有云业务上,讯飞同传新增注册同比增长168%。

此次演讲中,王玮坦言,AI 讯飞星火加持的应用可以让每个人可以更加美好,为这个社会做更多的帮助,在中间要找到值得期待的地方。

王玮强调,未来,AI 技术一定会对传统千行百业进行变革。随着新技术、新产品、新产业不断变化,讯飞会找到新的方向和位置。科大讯飞坚持“软硬一体”,尤其拥有自主可控、底层算力、算法、国际格局,有源头的技术生态,利用星火大模型智能体与场景业务对接,形成软件+硬件+服务的讯飞SaaS生态,让 AI 赋能千行百业。

以下是科大讯飞副总裁,听见科技总经理王玮演讲内容整理:

非常荣幸今天受刘湘明总的邀请来到美丽三亚,今天的开场既轻松又活泼,而且更加有内涵。所以我就在想,我今天用什么样的一种风格跟大家做交流。

大家可以看到,近两年,不管是做IT,还是做人工智能(AI),都不得不说“大模型”这三个字,不说好像就已经Out了。

2023年10月,Gartner发布2024年十大战略技术趋势,到2026年将有超过80%的企业使用生成式AI。而谷歌CEO桑达尔·皮查伊(Sundar Pichai)透露,当前有超过35%的企业已经在利用 AI。

因此,AI 大模型正在与每一个人息息相关。

不管是我们听到的医疗领域,还是物流领域,大模型、生成式 AI 到来之后都和我们产生的关系。

如果你是一名职员在一家广告公司里,还要想想做记录,现在有一些耳机已经帮你转成文字,甚至还给你做了纪要。尤其,现在一些客服人员在 AI 的辅助下效率得到极大提高。

如果你是一名程序员,生成式 AI 到来之后,这些类ChatGPT产品可以做对话、搭网站,一定程度上替代原来我写代码。因此,科大讯飞内部的程序员都有利用 AI 进行辅助,原本花三个月开发的工作,现在一个月就可以完成,甚至整个测试代码也开始用 AI 不断做改变。当然,有一些核心的代码还需要一些高端的算法工程师自己编写。

实际上,生成式 AI 到来之后,对媒体行业也有颠覆式改变,以前我们都要自己写,现在我搭一个框架,是不是可以让AI帮我改写、缩写、扩写,甚至是润色。我们自己也有一个讯飞写作,很多网络小说家如今也开始让大模型对话,辅助它创作,现在有很多的追更小说已经用大模型进行配合。

大模型已经到来以后,改变了我们(生活中)的方方面面。从去年开始,科大讯飞一步步不断迭代讯飞星火认知大模型,这个大模型是在完全自主可控的底座上面去做的。去年说“百模大战”,大家都在讲故事说概念。而科大讯飞是唯一一家不仅讲故事,而且还按照时间节点做,一个个都能落地的企业。

今年1月30日,我们完成了在全国产化算力底座上的万卡集群;6月27日,我们正式发布了星火4.0,增加了一些多模态交互和使用能力,现在已经全面对标GPT-4 Turbo。而且,现在讯飞也参加到大模型测试单位,整个公司都围绕生成式 AI 构建底层算力、中间算法和数据、上层应用的生态。

然而,我们也同时感受到,一轮一轮发展后,大模型让一脚油门踩下去到了80%,但回头一看,几个亿没了,进入到下半场是怎么落地、怎么应用。

科大讯飞成立至今已有25个年头,我们是平台+赛道,包括一个通用能力的底座模型,上面则赋能各行各业进行应用,比如教育、医疗、工业等场景。在工业方面,我们现在有很多“工业黑灯工厂”,而且讯飞和中国石油、中国移动共同发布行业大模型。很显然,AI 已经在各个领域都进行了应用。

下面我想跟大家分享办公领域的应用。

实际上,办公是我们在整个业务线中比较通用的领域。在2015年之后,我们发现办公室当中大家要经常开会,而开会的时候希望把每个人的讲话都能记录下来,因此,以这个需求为依托,我们打造了语音转文字技术,并且发展成为平台和商业化。我们并没有走完全的C端路线,而是在相对垂直领域里提供付费订阅模式,现在已经成为国内头部办公服务平台之一。不管是听见、写作,还是同传、会议,讯飞开始打造出一套SaaS办公平台。

核心层面,首先是 AI 和语言。 语言的背后是数据,哲学家说“语言即世界”,你听到的、表达的内容是你的观点。因为讯飞从起家就开始做语音识别、语音合成。因此,无论是识别,还是合成,讯飞听见做的是感知智能。而到了写作,大模型做的是认知。

从语言到认知,讯飞听见是办公场合的应用利器,同时还是在智能录音工具领域排行第一,大部分人是一线年轻人,有一些大学生、留学生学习时一边听老师讲课,一边记录下来。我们希望,讯飞听见能够成为你随身的语音记录助手,不仅能够记录,而且还能把文字进行提炼,做代办。

其次, 有了这样的语言记录之后,下一步做什么?做出海、要沟通,有很多同传和翻译需求。另外,现在文旅非常的火,包括今年上半年放开入境之后,在沟通、导览方面都能看到讯飞的翻译技术,而且讯飞的翻译机卖得不错,还有导览大厅上都已经在落地使用了。

再次是写作。 讯飞目前还有 AI 写作产品。相比其他产品,讯飞写作的优点在于,有语音素材可以一键导入,以前有一些生成式 AI 写作需要人进行辅助,因为大模型还有最后1公里、幻觉等问题。但讯飞写作借助已有素材或已有溯源内容再去写作,而且图文并貌,从而让你的写作更加事半功倍。

最后是会议。 讯飞既然做办公,尤其三年疫情形成线上会议,而疫情后,这种跨越式的和视频的交流已经变成生活的习惯,在会议背后有很多同传翻译、提炼、写作等工作,而且会议还可以潜入办公中、远程医疗等场景。

所以,利用大模型技术进行业务和场景结合,形成软件+硬件+服务的生态,构建了讯飞办公,尤其是讯飞SaaS办公的应用。

说完应用落地,和大家分享一下现在一些场景应用。

首先,我们在两会、香港立法会都参与其中,包括提供 AI 翻译、同传等功能,港府的立法会所有的开会最后的信息都在网上公开,对外输出的数字增加了一倍以上,现在我们也积极的进入到第三期,用大模型帮他做沟通,或者是发布,帮他做一些辅助立法的工作。

不仅如此,科大讯飞还是冬奥会和冬残奥会的翻译技术提供商,去年亚运会,我们还和央广进行合作。而今年刚结束的巴黎奥运会,我们也用 AI 技术提供同传服务,促进赛事、大赛无障碍交流。此外,也有很多世界500强公司开会时也使用讯飞同传服务。

而会议层面,截至目前,累计有500万间的 AI 会议室,包括政府和大型企业。现在我们也特别希望把这样的应用让更多的人用起来,现在我们也在加大SaaS平台服务力度,也在让更多的消费者使用。

钛媒体有一句话,大模型到来之后,AI 时代让大家人人平等,都能使用到。而讯飞也是这样的理念。

在国内,听障人士有2000万,国际上更多,所以讯飞听见发起了 AI 声音,免费把我们的应用开放给中国听障人士,只要上传了二代听障证书就可以免费使用。现在很多听障人士是识字的,我们给听障人群捐赠定向1亿分钟,用了这样的设备之后,可以正常的交流。

人工智能来了以后,为不能而战的人战斗,每天这种感动的故事在发生。我们也相信,在人工智能的加持下,它可以让每个人可以更加美好,为这个社会做更多的帮助,我们在中间要找到值得期待的地方。

未来,随着 AI 技术不断发展,一定会对传统行业发生变化。我觉得人最好的是学习力很强,会随着新技术、新产品、新产业的变化后,我们会重构,每个人找到新的方向和新的位置。我们坚持软硬一体,尤其是底层算力、算法、数据,都是自主可控、国际格局,中美在硬科技上的加持对抗之外,我们一定要有源头的技术生态。而且,大模型来了之后,现在我们还需要有各种各样的智能体,跟场景业务进行对接,赋能各行各业。

以前我们讲,“互联网+”,或者是“+互联网”。现在是“人工智能+”,或者是“+人工智能”,或者是“大模型+”、“+大模型”,技术不仅是技术,还是要落地,最后是重塑和繁荣整个行业生态。

从古老的行业开始,语言是民族的象征,而一种新的 AI 技术正在重塑语言这个行业。最后希望我们携手共建,共同繁荣生态,用最新的技术一起迎接美好的未来。谢谢大家!

(本文首发于钛媒体App,作者|林志佳,编辑|胡润峰)

科大讯飞董事、副总裁、董秘江涛:星火大模型显著推动AI智能硬件销售

每经记者:张宝莲 每经编辑:张海妮

出色的行业成长性和优良的公司基本面,是挑选一个优质投资标的之关键。2024年,哪些A股公司具备新价值机会?每日经济新闻《2024投资特刊》为您探访10家新价值公司,带给您第一手的公司信息与动向。

对标GPT4,超越GPT4,各大科技企业竞逐通用大模型。在不到一年的时间里,由通用大模型衍生而来的专业大模型在教育、医疗、工业、汽车等商业化领域中快速落地。2024年,人工智能科技企业又有何布局?

2023年12月21日,人工智能头部企业科大讯飞(SZ002230,股价46.05元,市值1066亿元)董事、副总裁、董秘江涛通过函件回复《每日经济新闻》记者采访称,通用认知大模型“智能涌现”将在信息分发、人机交互、民生资源供给等方面带来机遇,“2023年我们启动了更大参数的大模型训练,以全力对标GPT4,将在2024年上半年全力实现这一目标”。

国产大模型持续迭代

在江涛看来,通用认知大模型正在改变信息分发和获取的模式,实现更高效的信息整合和更精准的知识推荐。它也革新了内容生产模式,显著提升了人们的写作和办公效率。此外,通用认知大模型还全面升级了人机交互模式,未来人机之间可能实现多模态“类人”的自然对话。

江涛表示,在民生领域,通用认知大模型可以实现优质民生资源普惠供给,推动教育、医疗、司法等民生领域的运行效率和服务模式,产生重大的阶跃式进步。此外,它还颠覆了传统手工编程的代码生产方式,带来整个信息产业和数字经济发展的重大机遇和颠覆式变化。

而大模型2024年将走向何方?此前,科大讯飞董事长刘庆峰在接受包括《每日经济新闻》记者在内的媒体记者采访时表示:首先,为了对标GPT4,需要进行万亿浮点参数的训练,这是大模型的基本要求;其次,为了打造每个人的助手,需要AI人设,需要改进主动问答方面,特别是启发式、引导性的提问。此外,还需要将大模型的多模态能力、后台的知识学习表达能力与各个场景更深地融合,以大模型作为核心链接,将各种AI技术整合在一起提供解决方案。

刘庆峰说:“在这个过程中,我们会面临一些挑战,包括如何提高模型的性能、如何降低成本、如何更好地满足行业需求等。”

公司正在加速出海

江涛向《每日经济新闻》记者表示,面向政府及企业客户的大模型落地方式主要分为三种:第一,讯飞助力政府、高校等打造公共算力及大模型能力平台,提供星火大模型、算力底座、资源调度等端到端解决方案;第二,基于客户自有硬件,讯飞提供星火智算平台,以及私有化部署和训练的“软件+服务”私有化解决方案;第三,星火一体机完成行业大模型训练后,应用于快速发展阶段的边缘计算和推理需求。

此前,科大讯飞已经推进了相关大模型行业应用——联合行业龙头共同发布了金融、汽车、运营商、工业、住建、法律等12个行业大模型,并且陆续在教育、办公、汽车、金融、工业、医疗等行业推进相关应用落地的案例。

分析师认为,大模型将深入渗透到企业的经营生产。根据Gartner(一家咨询公司)此前发布的报告,预计2026年,超过80%的企业将使用生成式AI应用程序编程接口或模型,或在相关生产环境中部署支持生成式AI的应用程序。而在当下只有不到5%的企业将生成式AI运用在生产环境中。这意味着,在短短三年内,采用或创造生成式AI模型的企业数量预计将大幅增长。

据了解,截至2023年10月24日,讯飞人工智能开放平台自2023年5月6日星火大模型发布以来的开发者人数达到552.8万,新增开发者140余万人,其中,大模型开发者近30万。

此外,科大讯飞通过大模型赋能代码平台iFlyCode。刘庆峰曾在采访中表示,iFlyCode代码平台在科大讯飞未来的B端商业化中会是一个重要的部分,但它并不是唯一的商业化途径。“我们的目标是提供更加工具化的平台,降低定制成本,使我们的解决方案更加适用于各个行业。”他说。

在C端应用上,江涛向《每日经济新闻》记者表示,星火大模型对AI智能硬件销售的增长产生了显著推动作用。据京东商智和天猫生意参谋数据,“讯飞学习机、智能办公本、翻译机、录音笔、智能助听器等产品继续保持高质增长,并获得2023‘双11’京东&天猫7个品类销售冠军;讯飞AI硬件在全周期销售额同比增长126%”。

信达证券一份研报也指出,科大讯飞学习机在讯飞星火大模型的加持下销售取得显著增长:讯飞星火大模型发布后,2023年5月及6月,讯飞AI学习机GMV(商品交易总额)分别同比增长136%和217%。

科大讯飞还发布了C端另一应用——扫拖机器人,据称其具备领先的家庭环境全场景感知及运动能力,通过多模态交互,在家庭常见的障碍物中灵活穿梭不卡困。

除了国内竞争,科大讯飞正在加速出海。江涛向《每日经济新闻》记者表示,科大讯飞的AI硬件产品于2023年11月24日在新加坡正式上市,并参展第五届AES印尼家用电器及消费电子展。这意味着科大讯飞出海战略迈出关键实质性的一步。

每日经济新闻

相关问答

想毕业后去科大讯飞做软件测验,请问你知道讯飞测验工程师...

科大讯飞的产品都和和语音应用相关的产品,偏软件,具体哪些产品可以去科大讯飞的主页上查看。据我所知,他们语音识别产品的开发语言是C++。我觉得是硬件多些。...

在市面上的学习机牌子中,科大讯飞AI学习机T10怎么样?-ZOL问答

科大讯飞AI学习机T10的硬件设计就很为学生着想。13英寸LTPS高清全面屏,更接近试卷练习册大小,让学生能够很快适应用学习机学习,而且它还防眩光,模拟真实纸质阅...

科大讯飞AI学习机对孩子学习提升有效果吗?新品T20Pro值不值得购买?

你可以问问你的孩子值不值的买,学习这个玩意是靠主动,刚开始可以强迫,后面的靠自己,学习机不错也要问问使用者。而不是问网友,以前一本新华字典希望可以培养...

孩子英语口语、作文差,想提高一下英语成绩,科大讯飞学习机和步步高学习机哪个有用?

科大讯飞是完整的知识图谱架构,并且有技术加持的习得顺序智能推荐,起到引导学生针对弱项高效学习的作用;优学派是有单个知识点的智能诊断,就像是老师课堂布置...

讯飞星火是基于什么研发的?

讯飞星火大模型的研发基于GPT模型,并在此基础上进行了大量的优化和改进。科大讯飞团队增加了多种新的语言模型和知识图谱,从而提高了模型的性能和精度。该模型...

严浩翔ai语音怎么弄?

严浩翔的AI语音需要使用一些技术手段来实现。以下是一些可能的方法:1、使用语音合成软件:可以使用一些语音合成软件,例如科大讯飞、百度语音等,通过输入文本...

LUMION3.0软件对电脑什么硬件要求比较高-ZOL问答

科大讯飞翻译机3.0讨论回答(8)对于一般用户而言,如果不需要进行大型场景渲染...如果是编程,对硬件的要求不是特别高,处理器和内存好点就可以了如果涉及到图...

科大讯飞都有哪些产品?这些产品分别有什么用?

科大讯飞自成立后就专注于语音技术研究,随着近几年深度学习神经网络和大数据的发展,语音技术也超越了可用的阈值。而科大作为早期布局这一领域的引领者,把其在...

云知声与思必驰哪个好_思必驰使用问题-36氪企服点评

[回答]于是在2014年的时候,思必驰痛下决心将负责教育行业的部门剥离,以9000万卖给了网龙,自己则把精力收缩专注智能硬件和移动互联网,2017年9月发布了首个...

科大讯飞002230这只股票怎么样?-汇财吧专业问答test

[回答]经查证核实,002230科大讯飞,全称为安徽科大讯飞信息科技股份有限公司,属于信息技术类科技板块,智能概念股票。科大讯飞002230,业绩一般,负债不高。...

猜你喜欢