字节跳动加速AI布局

企业新闻1年前 (2023)发布 aixure

89 0 0

导读：本报记者李昆昆李正豪北京报道 11月27日，亦即字节跳动确认收缩游戏业务当天，《中国经营报》记者注意到，字节跳动成立了一个新的AI（人工智能）部门Flow，技术负责人为字节跳动技术副总裁洪定坤，业务带头人为字节跳动大模型团队的负责人朱文佳。Flow 的…

本报记者李昆昆李正豪北京报道

11月27日，亦即字节跳动确认收缩游戏业务当天，《中国经营报》记者注意到，字节跳动成立了一个新的AI（人工智能）部门Flow，技术负责人为字节跳动技术副总裁洪定坤，业务带头人为字节跳动大模型团队的负责人朱文佳。Flow 的相关招聘信息显示，Flow 是字节跳动旗下 AI 创新业务团队，目前已在国内和海外分别上线了豆包和 Cici 两款产品，还有多个 AI 相关创新产品在孵化中。业内普遍认为，这也许是字节跳动在收缩游戏业务的同时，加码AI应用开发的信号。

《中国经营报》记者打开豆包App发现，发现其已经上线了编程助理、文学伴侣、爆款文案、恋爱大师等应用功能，值得一提的是，豆包上还上线了创建AI智能体功能，所有用户都可以在豆包上创建自己的AI智能体。

记者询问豆包都有哪些应用场景，结果显示：“我是字节跳动公司基于云雀模型开发的人工智能，我的名字叫豆包。我可以应用于自然语言处理、对话系统、智能客服、内容生成、智能助手、教育培训等场景。这些只是我的一些应用场景，随着技术的不断发展，我的应用场景还会不断扩展。”

而Cici主打海外市场，2023年8月已在海外多个市场上线，目前已在36个国家和地区上线，基本上除了欧美成熟市场之外的全球其他区域均有覆盖。

创建AI智能体

实际上，早在2016年，字节跳动就成立了AI实验室，聚焦于自然语言处理、机器学习、数据挖掘等方面的研究。抖音、今日头条等字节跳动旗下产品中也频频加入AIGC（生成式人工智能）功能，持续吸引流量。

一直以来，AI在字节跳动的核心业务中都扮演着重要的角色。根据官方披露的抖音标签算法图，AI处于整个流程的核心地位。从机器视频检测，到结合关键词匹配，再到叠加推荐、系统“挖坟”、更高级别流量池，相关场景都出现了AI的加持。

在豆包的界面中，尤其引人注意的是，每个用户都可以在豆包上创建自己的AI智能体来获取粉丝，粉丝可以与AI智能体对话。记者试着在豆包上创建了自己的智能体，咨询问题都会收到自动回复。

比如，记者问豆包的数据来源来自哪里，豆包是这样回答的：“我是基于字节跳动的云雀模型开发的人工智能，我的训练数据来自于互联网、书籍、新闻、社交媒体等多个领域的文本数据。这些数据经过清洗、预处理和标注等一系列处理步骤后，被用于我的训练。”

谈及豆包与OpenAI、文心一言等大模型产品的区别，盘古智库高级研究员江瀚告诉本报记者：“从优势来看，一是专注于某一领域，豆包可能专注于某一特定领域，如娱乐，这使得它在该领域内的理解和应用可能更深入。二是本地化优势，如果豆包是针对某一特定地区或国家开发的，它可能更好地理解该地的文化、习惯和语言，从而在某些任务上表现出色。从劣势看，一是规模较小，与OpenAI和文心一言等相比，豆包可能在模型大孝训练数据量和计算资源上都有所限制，这可能会影响其在某些任务上的性能。二是通用性差，由于豆包当前专注于某一领域或地区，它在其他领域或地区的性能不如大型通用模型。”

记者了解到，豆包的训练数据来自互联网上的大量文本，包括新闻、博客、小说、论文等，而OpenAI的训练数据则来自多个领域的文本，包括科学、技术、艺术等；豆包的模型结构是基于深度学习的，使用了多层神经网络，而OpenAI 的模型结构则是基于强化学习的，使用了深度强化学习算法；豆包的应用场景主要是自然语言处理，包括文本生成、问答、翻译等，而OpenAI的应用场景则更加广泛，包括机器人、游戏、金融等领域。

总的来说，目前豆包和OpenAI的区别可能在于其训练数据、模型结构和应用场景不同。

大模型百花齐放

大模型是今年互联网行业的关键词。实际上，从2021年起，中国就涌现了一些有代表性且具备影响力的大模型。受ChatGPT影响，国内大模型在2023年进入高速发展阶段，一时间呈现“百模大战”局面。根据赛迪顾问数据，截至2023年7月底，中国累计发布了130个大模型，其中64个大模型是在2023年内发布。国内大模型技术分布基本与海外一致，65%的大模型集中在自然语言领域，22%的大模型集中在多模态领域。

从全球范围来看，中国和美国在大模型领域引领全球发展。根据中国科学技术信息研究所、科技部新一代人工智能发展研究中心联合发布的《中国人工智能大模型地图研究报告》，截至2023年5月，美国已发布100个参数规模10亿以上的大模型。中国亦积极跟进全球大模型发展趋势，自2021年以来加速产出，如2021年6月北京智源人工智能研究院发布1.75万亿参数量的悟道2.0、2021年11月阿里M6大模型参数量达10万亿等。

同时，在应用方面，基于通用大模型能力已相对成熟可用，其上的应用生态已逐渐繁荣。得益于对先进算法模型的集成以及较早的产品化，OpenAI不仅展现了GPT（生成式预训练Transformer模型）在人机对话中的超预期表现，同时基于GPT的应用生态也已逐渐繁荣，微软数款产品（Bing、Windows操作系统、Office、浏览器、Power Platform等）、代码托管平台GitHub、AI营销创意公司Jasper等均已接入GPT。

2023年，字节跳动在AI领域的动作明显加快。6月，火山引擎发布大模型服务平台火山方舟，运营模式是在一个平台内提供多个模型，让企业用户同步试用，并选用更适合自身业务需要的模型组合，本质上扮演了“卖铲人”的角色。其自研的通用大模型“云雀”始终没有官宣，直到今年8月才在首批通过《生成式人工智能服务管理暂行办法》大模型名单中露出。8月17日，字节跳动公测基于云雀大模型开发的AI聊天机器人“豆包”，面向C端市场发力AI应用。此外，市场还传出了字节跳动正在计划开发云端AI芯片和Arm服务器芯片的消息。

在算力储备方面，字节跳动今年向英伟达订购的GPU产品总价超10亿美元，接近英伟达去年在中国销售的商用GPU总和，而GPU是AI训练不可或缺的计算基础设施。

谈及是否看好豆包未来的发展，财经专栏作者马继鹏对本报记者说：“目前来讲，还是比较有潜力的，可能取决于几个方面，一是字节跳动的云雀模型在业内来说还是比较先进的，之前有消息说字节跳动在AI芯片储备方面还是有优势的，所以它的底层技术实力不用担心。二是字节跳动有很好的写大模型代码的人。三是因为字节跳动也有庞大的数据能力，一定会把云雀大模型训练得比较聪明。基于以上三点，如果这个大模型本身比较先进、比较聪明的话，那它上面的应用应该也不会太差。”

江瀚认为，豆包的未来取决于多个因素，包括其技术路线、市场定位、合作伙伴和竞争格局等。如果豆包无法突破技术或资源的限制，或者面临激烈的竞争和市场压力，它的未来发展可能会受到挑战。但如果豆包能够继续深化其在特定领域或地区的技术和应用优势，并与其他企业或机构建立合作关系，它有可能在该领域或地区取得领先地位。另外，如果豆包能够持续投入研发，跟上技术发展的步伐，并扩大其模型和数据的规模，它也有可能成为一个更具竞争力的通用模型。

# 企业新闻