计算机行业AI应用专题报告:微软拉开AI应用序幕

人工智能应用1年前 (2023)发布 aixure
52 0 0
导读:(报告出品方/作者:民生证券,吕伟) 1 ChatGPT 开放 API 接口,引领 AI 领域新革命 1.1 OpenAI 开放 ChatGPT API 接口 2023 年 3 月 2 日,OpenAI 推出了自然语言对话模型 GPT-3.5-Turbo 和语 音转文本模型 Whisper models 的开发者 API。ChatGPT-3.5 Turb…

(报告出品方/作者:民生证券,吕伟)

1 ChatGPT 开放 API 接口,引领 AI 领域新革命

1.1 OpenAI 开放 ChatGPT API 接口

2023 年 3 月 2 日,OpenAI 推出了自然语言对话模型 GPT-3.5-Turbo 和语 音转文本模型 Whisper models 的开发者 API。ChatGPT-3.5 Turbo 模型是 GPT-3.5 系列中最快速、最便宜、最灵活的模型,具有高准确性、可靠性和可扩 展性,能以极低的成本获取精准的结果。GPT-3.5 Turbo 作为新型自然语言处理 模型,使人类与计算机之间的交流更加顺畅和高效。Whisper 是 Open AI 在 22 年 9 月开源的语音转文本模型,支持其它 98 种语言的自动语音辨识。Whisper 系统所提供的自动语音辨识模型能将各种语言的语音变成文本,接受 m4a、mp3、 mp4、mpeg、mpga、wav、webm 等多种格式,其核心业务是语音辨识与翻 译任务。Whisper 无需联网,完全在本地运行,识别准确率高,可称为本地类脑。

GPT-3.5-Turbo 和 Whisper models 的 API 价格低廉,功能强大。 GPT-3.5-Turbo 模型定价 0.002 美元 / 1000 tokens,价格是 GPT 3.5 模型额 1/10;参数数量更多,能够生成更准确、更具上下文相关性的响应;包括额外的 训练数据和微调,进一步提高了性能,适合应用于语言翻译、聊天机器人开发、 内容生成等。与传统的自然语言处理算法相比,GPT-3.5 Turbo 有着更强大的抽 象能力和语法识别能力,能够准确地理解人类语言的含义和上下文,并将其转化 为精准的文本输出。Whisper 的英文语音辨识能力已达到人类水准,可以用来转 录或翻译音频,识别准确率相当高,可以在本地运行,费用为每分钟 0.006 美元。

1.2 ChatGPT API 应用走入千行万业

目前已有多个应用程序通过 API 的方式将 ChatGPT 融入到服务之中。 OpenAI 向企业开放 API 端口,社交软件 SnapChat、购物软件 Instacart、学习 软件 Quizlet 和 Speak 等均已嵌入 ChatGPT API。IT 之家 2 月 28 日消息,2023 年 3 月 7 日,微软发布 Windows 11 重要更新,相关更新将重塑和提升人们通过 PC 完成各项事务的使用体验。微软作为 PC、云、移动终端集大成的 AI 厂商,在 OpenAI 的赋能下,从应用的制高点层层推进,此次 PC 端“开始”菜单的重构将 成为应用端迈进 AI 时代的起点。多个应用程序通过 API 的方式将 ChatGPT 融入 到服务之中表明两个新的 API 有利于扩大 AI 的应用场景,丰富 ChatGPT 的应用 生态,优化人工智能应用的商业模式,为人工智能的发展和应用带来巨大推动力。此外,ChatGPT 模型还在不断改进、自我完善,未来将有更多增强功能供 APP 开 发人员使用,ChatGPT 的应用场景或将更加丰富。

2 成本降低有望催动海量应用进入 AI 时代

2.1 新模型 gpt-3.5-turbo 发布,成本降低 90%

与传统搜索引擎相比,聊天机器人的运营成本高昂。摩根士丹利的分析表示, 谷歌去年共计 3.3 万亿次搜索,每次搜索的成本仅为 0.2 美分。而此前有分析师指 出,ChatGPT 的一次回复则会产生 2 美分的成本。摩根士丹利预计,若将谷歌旗 下聊天机器人 Bard 引入搜索引擎,并用其处理谷歌一半的搜索和提问,按照每次 答案 50 词计算,该公司 2024 年的成本可能会增加 60 亿美元。专注于芯片技术 的咨询公司 SemiAnalysis 表示,受到谷歌的内部芯片 Tensor Processing Units 等的影响,将聊天机器人添加至搜索引擎中,可能会导致该公司额外花费 30 亿美 元。

OpenAI 新模型使成本大幅降低。3 月 1 日,OpenAI 正式宣布,开发者现在 可以通过 API 将 ChatGPT 和 Whisper 模型集成到他们的应用程序和产品中。此 次 ChatGPT API 访问的模型被称为 gpt-3.5-turbo,gpt-3.5-turbo 和 ChatGPT 产品使用相同的模型,定价只要 0.002 美元/1000 tokens,后者可以看作一个非 结构化的单词,1000 个相当于 750 个单词,算下来就是企业付费 2 美元就可以 输出 75 万单词。现在这个价位做到了让人类普惠性使用 AI,也是其他 AI 公司目 前做不到的价位。随着 ChatGPT 开放 API,很多公司可以正式接入 ChatGPT 的 AI 服务。

2.2 GPT-3.5 的三大优势

与 GPT-3 相比,GPT-3.5 增加代码训练(Code-training)与指示微调 (Instruction-tuning)两个训练步骤:1)代码训练:经过前期的代码训练, GPT-3.5 模型具备更好的代码生成与代码理解能力,同时间接拥有了使用思维链 进行复杂推理的能力;2)指示微调:经历 Instruction-tuning,GPT-3.5 具备更 好的模型泛化能力,同时模型的生成结果更加符合人类的预期。 GPT-3.5 具备三大优势,ChatGPT 实现优势融合。基于模型训练的持续优 化,与 GPT-3 相比,GPT-3.5 具备三大优势:更强的复杂推理能力,更好的人 类指令响应,更全面的文本、代码生成能力。作为基于 GPT-3.5 的模型微调产物, ChatGPT 实现了 Code-training、Instruction-tuning、RLHF 等训练的优势整 合,我们针对 ChatGPT 优势进行能力溯源:

1)预训练大模型:ChatGPT 具备的语言生成能力、基础世界知识、上下文 学习能力等基本能力均来源于基于 Transformer 的模型预训练;大量知识的存储 能力依托于庞大的模型参数(GPT-3 模型参数为 1750 亿); 2)代码训练:ChatGPT 具备较好的代码生成与代码理解能力,同时具备执行复杂推理的能力,主要得益于代码训练 Code-training 的引入;初代 GPT-3 未 进行过专门的代码训练,因此在代码生成、理解方面能力相对较差,同时推理(思 维链)能力也较差;因此可以判断,代码训练是 ChatGPT 上述能力的重要来源; 3)人类反馈强化学习:ChatGPT 具备更好的问答能力,同时可以拒绝不当 的问题、拒绝知识范围之外的问题,这些在对话问答上的突出表现,得益于人类 反馈强化学习 RLHF 的训练,让 ChatGPT 更加遵循人类的价值观,同时拥有了 建模对话历史、增加对话信息量等能力。

2.3 ChatGPT 改变应用生态,赋能千行百业

2.3.1 Bing&Edge+AI

2023 年 2 月 8 日,微软公司发布了新版必应 AI 搜索引擎和 Edge 浏览器, 采用了 ChatGPT 开发商 OpenAI 的最新技术 AI 模型 GPT-3.5 的升级版, 率先提供更具对话性的网络搜索和创建内容的替代方式,集搜索、浏览、聊天于 一体,带来前所未有的全新体验。新版必应还更加“人性化”,不仅会为用户提 供问题选项,还会在回复中使用表情符号;新版必应更加“严谨”,会在回复中 标注所引用的来源,并列出对应网站;新版必应更加智能,AI 聊天搜索能够通过 自然语言处理技术对用户提出的问题进行分析和理解,从而能够给出更加智能化 的搜索结果;新版必应更加个性化,通过对用户提出的问题进行分析和理解,AI 聊天搜索可以给出更加个性化的搜索结果,满足用户不同的需求;新版必应更加 便捷,AI 聊天搜索可以通过对话的形式进行搜索,用户可以通过直接与搜索引擎 进行对话的方式获取所需的信息,更加便捷快捷。

AI 聊天搜索可以应用于各种不同的场景。例如: 1.旅游出行:在旅游出行过程中,用户可能需要查询各种信息,例如交通路线、 景点介绍、天气预报等。通过 AI 聊天搜索,用户可以直接向搜索引擎提出问题, 获取所需的信息。 2.学习研究:在学习和研究过程中,用户可能需要查询各种资料和文献。通过 AI 聊天搜索,用户可以直接向搜索引擎提出问题,获取所需的资料和文献。 3.工作咨询:在工作中,用户可能需要查询各种信息,例如公司资料、行业资 讯等。通过 AI 聊天搜索,用户可以直接向搜索引擎提出问题,获取所需的信息。 微软企业副总裁兼消费领域首席营销官 Yusuf Mehdi 公布的最新推文称, 在新版 Bing 上线 48 小时内,已经有超过 100 万人申请加入。

2.3.2 美股 AI 龙头 C3.AI 启示录:聚焦 AI 应用侧最佳“掘金铲”

C3.AI 在赋能海量应用的同时,也不断拔高自身的稀缺性,而看似无解定制化 开发的恶性循环,也在生成式 AI 与边缘 AI 的相结合下,有望迎来真正的突破。 边缘 AI 是指在硬件设备上本地处理的 AI 算法,可以在没有网络连接的情况 下处理数据。即:在无需流式传输或在云端数据存储的情况下进行数据创建等操 作。在边缘计算通过云上的深度学习生成数据,而在数据原点即设备本身(边 缘)执行模型的推断和预测的模式下,边缘 AI 的优势相比边缘计算进一步在智能 与实时洞察等方面升华。 边缘 AI 通过反馈循环,一方面作为推理引擎向(B/C/G 端)用户输出答案, 另一方面作为流量入口对用户数据进行首次处理。在边缘 AI 部署中,推理引擎在 工厂、医院、汽车、卫星和家庭等偏远地点的某种计算机或设备上运行边缘 AI 将成为一个“推理引擎”回答现实世界的问题。当 AI 偶然发现问题时,通常会将有 问题的数据上传到云端,以便对原始 AI 模型进行进一步训练,在某种程度上取代 边缘的推理引擎。这种反馈回路在提高模型性能方面发挥着重要作用。

据 C3.AI 官网,加入生成式 AI(如 ChatGPT)后,边缘 AI 能力将迎来跃升, 主要表现如下: 1)快速访问相关、关键和高价值的答案,解决企业用户不同的数据存储、业 务应用程序和其他关键数据存储系统信息孤岛问题; 2)提高数据安全性和增强治理基于角色和异常的访问控制; 3)企业范围内的协作和知识共享集中、自动化和连续地索引,了解企业信息 的整个语料库系统,自动形成定制化效果; 4)提高数据科学的生产力和效率。

2.3.3 从顶层设计向应用侧迈进是所有新技术的生命脉络

早期 AIGC 在文本生成领域落地,逐渐向音频生成、图像生成等领域推广。 以 ChatGPT 为代表的的 AIGC 作为当前新型的内容生产方式,已经率先在传媒、 电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大创新发展,市 场潜力逐渐显现。AIGC 在音频、图像、视频生成创作等领域落地,形成多点开花 的发展趋势。 全球范围内的一些 AIGC 公司已初步具备变现能力。AIGC 应用层可分为图像、 文本、视频、音频,海外 AIGC 企业如 Jasper、Grammarly 等已经积累大批用户 群体,年收入超千万美元。

ChatGPT 具备强大自然语言处理、多轮问答能力,可落地于广泛的应用场景。 ChatGPT 将在未来投入商业化领域,通过强化的上下文理解能力,优化银行、电 商等客服机器人,生成商品描述和营销文案,以及协助翻译工作,大大提高服务 质量。 OpenAI 通过战略投资,产业赋能,加速 ChatGPT 在实际应用中落地。作 为 AI 行业龙头 OpenAI,公司不止自身持续开发出惊动业界的 AI 模型如 GPT 系列模型,而且创立基金投资于 AI 创业公司,不断拓宽 AI 应用边界,重塑人 类的创造力、法律、生产力、教育等方面能力。 未来,ChatGPT 亦可应用在数字营销的多个领域,譬如内容创建、个性化广 告文案、电子邮件营销等等,助力增强行业的生产力。

3 GPT 率先赋能海外,相关布局厂商将优先受益

GPT 将率先赋能于海外业务,映射至国内率先布局海外应用的相关企业将优 先收获 GPT 赋能。截至目前,中科创达已与多家海外厂商建立密切合作,在边缘 计算和行业领域初具规模;梦网科技、金桥信息等厂商找到 ChatGPT 相关业务突 破口,有望加快推进 AI 应用侧产品落地;昆仑万维、万兴科技等厂商已与 OpenAI 达成合作,即将接入 ChatGPT 相关功能;福昕软件、汤姆猫等厂商的海外业务收 入占比超 30%,有望于 GPT 领域充分受益。

3.1 中科创达:海外收入占比可观,边缘计算和行业领域初 具规模

2022 年,中科创达整体及各个业务板块取得了全面增长,海外业务收入规模 仍保持在较高水平,实现 33.19%的海外收入占比。 在云计算生态方面,中科创达已经与亚马逊云技术,微软 Azure,谷歌云计 算,阿里等多家云计算公司建立密切合作,能够帮助企业客户更好的管理数据资 源,并对其进行分析与处理,实现数据价值释放与业务赋能。

同时,中科创达在边缘计算和行业领域已经初具规模,以公司边缘计算技术 为核心的智能行业相关业务,2022 年度实现营业收入 2.2 亿元。公司和芯片厂商 在共同推动边缘计算和智能行业的发展。由于公司在操作系统方面产品和技术完 备,包括中间件、具体的行业中间件算法,整个开发工具链和环境等,都可以形 成平台化方案。公司董秘表示,“OpenAI 的成功探索,验证了通用人工智能大模 型是人工智能的发展方向”。

3.2 梦网科技:ChatGPT 有望带来 5G 消息重构

5G 消息的核心应用 Chatbot (聊天机器人),其本质是随时响应用户消息 服务,与 ChatGPT 的交互性不谋而合。作为 5G 消息的行业龙头梦网科技,在携 手三大运营商及头部终端厂商,于金融、政务、互联网等多个行业领域应用,构 建十数万家大中型企业与超十亿个人用户的沟通桥梁,并通过云短信、云 5G 富媒 体消息、AIM/短信小程序(富信 2.0)、Chatbot 消息等功能筑造供多网合一的 统一消息中心,5G 消息布局已初现峥嵘。

根据梦网科技 2021 年报数据,公司已经完成了金融、互联网、政务公共事业 以及消费品等新兴重要行业和客户的市场布局。天然具备“数据桥梁”的作用结 合其核心产品Chatbot,与 ChatGPT 在交互层面上存在互补,并在后续向专 用领域演化的道路上,有望形成强强联合之势。同时,公司的海外营业收入增长 迅速,2022 年上半年,公司在海外市场取得营业收入 4594.32 万元,较上年同期 增长 453.44%。

3.3 金桥信息:布局"AI 法院"深度应用场景

司认为“Al+法院”是 ChatGPT 的最佳应用场景:法院业务流程中涉及立 案、审判、执行等多个环节,产生大量会议、文件、卷宗,是 ChatGPT 的最佳使 用场景。目前金桥信息与蚂蚁在人工智能领域深度合作,要素式立案平台就是典 型的 AI 赋能下的复杂文本结构化标准化处理平台。

金桥的云平台业务主要聚焦法院信息化,以移动执行平台为典型代表,通过 管理平台+移动 APP 的形式解决法院在执行过程中的突出痛点。该业务目前已经 实现 3500+法院的全覆盖,同时采用 Saas 模式收费,商业模式更优。同时,截 至 2022 年上半年,公司在海外的资产为 598.96 万元。

3.4 福昕软件:成为百度“文心一言”首批生态合作伙伴

2023 年 2 月,福昕软件宣布成为百度“文心一言”首批生态合作伙伴,后续 将优先内测体验并接入“文心一言”的全面能力,将百度领先的智能对话技术成 果应用在版式文档办公软件领域,打造更专业、更友好、更智能的数字化、智能 化办公服务。此举标志着福昕软件优先获得领先 AI 技术的加持,也意味着对话式 语言模型技术在数字化办公场景的首次着陆。 通过此次合作,福昕软件可优先内测试用“文心一言”,集成“文心一言” 的技术能力,在百度技术团队协助下通过“文心一言”对话式语言模式的赋能,向客户提供更智能、更精准的软件帮助和支持。

福昕软件 2022 年前三季度实现营业收入 4.27 亿元,同比上涨 7.04%。按照 地区分类,福昕软件主营业务地区分为境内和境外。据公司年报披露,2021 年公 司实现境内营业收入 0.50 亿元和境外营业收入 4.91 亿元,分别占总营收 9.27% 和 90.73%。

3.5 万兴科技:公司已对接 Azure OpenAI 开通商用服务 权限

2023 年 2 月 25 日,万兴科技表示“公司已对接 Azure OpenAI 开通商用服 务权限”,是国内首批获得 Azure OpenAI 商用服务权限的企业,是全球领先的 新生代数字创意赋能者,旗下知名产品包括万兴喵影、万兴优转、万兴爱画等, 业务覆盖全球 200 多个国家和地区,用户超 15 亿,被外界称为“中国版 Adobe”。

2023 年 2 月,万兴科技旗下视频创意软件 Wondershare Filmora 新版本 全新接入 ChatGPT 母公司 OpenAI 相关服务,率先在视频创作领域集成 AIGC 新技术。据介绍,新版本可自由调用 OpenAI 的 AI 绘图功能,一键即可智能生成 图片素材。未来万兴科技将逐步深化与以 OpenAI 为代表的 AI 上游技术商合作, 借助 AIGC 技术持续升级和推出产品。

3.6 昆仑万维:Opera 浏览器与 Open AI 团队达成合作, “昆仑天工”模型已开源

2023 年 2 月 27 日,昆仑万维集团宣布,旗下的 Opera 浏览器与人工智能研 究实验室 Open AI 团队达成合作,通过访问 OpenAI 的 API 和领先的人工智能 模型,在其浏览器内正式接入 ChatGPT 功能,成为继微软 Bing 搜索引擎、Edge 浏览器之外,又一家深度集成 AIGC 功能的浏览器,用户可通过 Opera 地址栏中 新设置的 shorten 按钮,用 AI 来生成网页和文章的总结或是摘要。

昆仑万维表示,2022 年 12 月,其全系列 AIGC 算法和模型“昆仑天工”在 北京发布,并已宣布模型开源,目前已有中国移动咪咕等企业测试使用。另外, 昆仑万维还宣布将与奇点智源合作,在 2023 年内发布中国版类 ChatGPT 的代码 并开源。

截至 2022 年上半年末,公司业务遍及全球一百多个国家和地区,累计月活跃 用户近 4 亿。2022 年上半年,公司实现营业收入 22.5 亿元;其中,海外业务继 续保持高增长,营收占比进一步提升至 74%,同比提升 5pct。同期,公司整体毛 利率水平进一步提升至 79%,同比增长 8pct。其中,海外业务毛利率稳步提升, 达到 83%,较去年同期增长 12pct。

3.7 汤姆猫:已尝试应用 ChatGPT 模型进行 AI 交互产品 开发的初步测试

2023 年 2 月 13 日,汤姆猫称公司汤姆猫家族 IP 的智能交互属性与 ChatGPT 有着较高的契合度,目前公司团队已尝试应用 ChatGPT 模型进行 AI 交互产品开发的初步测试。此前公司在类似项目上已积累了一定经验优势,推出 了 GameBudTalking Tom 语音智能产品,该智能产品可与公司旗下《汤姆猫跑酷》 等游戏产品进行链接,实现游戏陪玩、线下交流、语音互动等多个功能。

从业务构成来看,支撑汤姆猫营收增长的主要动能是广告业务,而广告收入 则来自于 2017 年收购的 Outfit7。截至 2022 年 11 月,公司汤姆猫家族 IP 系列 休闲游戏累计下载量已超过 190 亿次,月活跃用户数最高达 4.7 亿次;会说话的汤姆猫家族 IP 的动漫影视作品被翻译成 32 种不同的语言,在全球 200 多个国家 和地区播放,全球累计播放量超过 850 亿次”。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

精选报告来源:【未来智库】。

赞助本站

© 版权声明

相关文章

暂无评论

暂无评论...