字节跳动加速AI布局

企业新闻12个月前发布 aixure
83 0 0
导读:本报记者 李昆昆 李正豪 北京报道 11月27日,亦即字节跳动确认收缩游戏业务当天,《中国经营报》记者注意到,字节跳动成立了一个新的AI(人工智能)部门Flow,技术负责人为字节跳动技术副总裁洪定坤,业务带头人为字节跳动大模型团队的负责人朱文佳。Flow 的…

本报记者 李昆昆 李正豪 北京报道

11月27日,亦即字节跳动确认收缩游戏业务当天,《中国经营报》记者注意到,字节跳动成立了一个新的AI(人工智能)部门Flow,技术负责人为字节跳动技术副总裁洪定坤,业务带头人为字节跳动大模型团队的负责人朱文佳。Flow 的相关招聘信息显示,Flow 是字节跳动旗下 AI 创新业务团队,目前已在国内和海外分别上线了豆包和 Cici 两款产品,还有多个 AI 相关创新产品在孵化中。业内普遍认为,这也许是字节跳动在收缩游戏业务的同时,加码AI应用开发的信号。

《中国经营报》记者打开豆包App发现,发现其已经上线了编程助理、文学伴侣、爆款文案、恋爱大师等应用功能,值得一提的是,豆包上还上线了创建AI智能体功能,所有用户都可以在豆包上创建自己的AI智能体。

记者询问豆包都有哪些应用场景,结果显示:“我是字节跳动公司基于云雀模型开发的人工智能,我的名字叫豆包。我可以应用于自然语言处理、对话系统、智能客服、内容生成、智能助手、教育培训等场景。这些只是我的一些应用场景,随着技术的不断发展,我的应用场景还会不断扩展。”

而Cici主打海外市场,2023年8月已在海外多个市场上线,目前已在36个国家和地区上线,基本上除了欧美成熟市场之外的全球其他区域均有覆盖。

创建AI智能体

实际上,早在2016年,字节跳动就成立了AI实验室,聚焦于自然语言处理、机器学习、数据挖掘等方面的研究。抖音、今日头条等字节跳动旗下产品中也频频加入AIGC(生成式人工智能)功能,持续吸引流量。

一直以来,AI在字节跳动的核心业务中都扮演着重要的角色。根据官方披露的抖音标签算法图,AI处于整个流程的核心地位。从机器视频检测,到结合关键词匹配,再到叠加推荐、系统“挖坟”、更高级别流量池,相关场景都出现了AI的加持。

在豆包的界面中,尤其引人注意的是,每个用户都可以在豆包上创建自己的AI智能体来获取粉丝,粉丝可以与AI智能体对话。记者试着在豆包上创建了自己的智能体,咨询问题都会收到自动回复。

比如,记者问豆包的数据来源来自哪里,豆包是这样回答的:“我是基于字节跳动的云雀模型开发的人工智能,我的训练数据来自于互联网、书籍、新闻、社交媒体等多个领域的文本数据。这些数据经过清洗、预处理和标注等一系列处理步骤后,被用于我的训练。”

谈及豆包与OpenAI、文心一言等大模型产品的区别,盘古智库高级研究员江瀚告诉本报记者:“从优势来看,一是专注于某一领域,豆包可能专注于某一特定领域,如娱乐,这使得它在该领域内的理解和应用可能更深入。二是本地化优势,如果豆包是针对某一特定地区或国家开发的,它可能更好地理解该地的文化、习惯和语言,从而在某些任务上表现出色。从劣势看,一是规模较小,与OpenAI和文心一言等相比,豆包可能在模型大孝训练数据量和计算资源上都有所限制,这可能会影响其在某些任务上的性能。二是通用性差,由于豆包当前专注于某一领域或地区,它在其他领域或地区的性能不如大型通用模型。”

记者了解到,豆包的训练数据来自互联网上的大量文本,包括新闻、博客、小说、论文等,而OpenAI的训练数据则来自多个领域的文本,包括科学、技术、艺术等;豆包的模型结构是基于深度学习的,使用了多层神经网络,而OpenAI 的模型结构则是基于强化学习的,使用了深度强化学习算法;豆包的应用场景主要是自然语言处理,包括文本生成、问答、翻译等,而OpenAI的应用场景则更加广泛,包括机器人、游戏、金融等领域。

总的来说,目前豆包和OpenAI的区别可能在于其训练数据、模型结构和应用场景不同。

大模型百花齐放

大模型是今年互联网行业的关键词。实际上,从2021年起,中国就涌现了一些有代表性且具备影响力的大模型。受ChatGPT影响,国内大模型在2023年进入高速发展阶段,一时间呈现“百模大战”局面。根据赛迪顾问数据,截至2023年7月底,中国累计发布了130个大模型,其中64个大模型是在2023年内发布。国内大模型技术分布基本与海外一致,65%的大模型集中在自然语言领域,22%的大模型集中在多模态领域。

从全球范围来看,中国和美国在大模型领域引领全球发展。根据中国科学技术信息研究所、科技部新一代人工智能发展研究中心联合发布的《中国人工智能大模型地图研究报告》,截至2023年5月,美国已发布100个参数规模10亿以上的大模型。中国亦积极跟进全球大模型发展趋势,自2021年以来加速产出,如2021年6月北京智源人工智能研究院发布1.75万亿参数量的悟道2.0、2021年11月阿里M6大模型参数量达10万亿等。

同时,在应用方面,基于通用大模型能力已相对成熟可用,其上的应用生态已逐渐繁荣。得益于对先进算法模型的集成以及较早的产品化,OpenAI不仅展现了GPT(生成式预训练Transformer模型)在人机对话中的超预期表现,同时基于GPT的应用生态也已逐渐繁荣,微软数款产品(Bing、Windows操作系统、Office、浏览器、Power Platform等)、代码托管平台GitHub、AI营销创意公司Jasper等均已接入GPT。

2023年,字节跳动在AI领域的动作明显加快。6月,火山引擎发布大模型服务平台火山方舟,运营模式是在一个平台内提供多个模型,让企业用户同步试用,并选用更适合自身业务需要的模型组合,本质上扮演了“卖铲人”的角色。其自研的通用大模型“云雀”始终没有官宣,直到今年8月才在首批通过《生成式人工智能服务管理暂行办法》大模型名单中露出。8月17日,字节跳动公测基于云雀大模型开发的AI聊天机器人“豆包”,面向C端市场发力AI应用。此外,市场还传出了字节跳动正在计划开发云端AI芯片和Arm服务器芯片的消息。

在算力储备方面,字节跳动今年向英伟达订购的GPU产品总价超10亿美元,接近英伟达去年在中国销售的商用GPU总和,而GPU是AI训练不可或缺的计算基础设施。

谈及是否看好豆包未来的发展,财经专栏作者马继鹏对本报记者说:“目前来讲,还是比较有潜力的,可能取决于几个方面,一是字节跳动的云雀模型在业内来说还是比较先进的,之前有消息说字节跳动在AI芯片储备方面还是有优势的,所以它的底层技术实力不用担心。二是字节跳动有很好的写大模型代码的人。三是因为字节跳动也有庞大的数据能力,一定会把云雀大模型训练得比较聪明。基于以上三点,如果这个大模型本身比较先进、比较聪明的话,那它上面的应用应该也不会太差。”

江瀚认为,豆包的未来取决于多个因素,包括其技术路线、市场定位、合作伙伴和竞争格局等。如果豆包无法突破技术或资源的限制,或者面临激烈的竞争和市场压力,它的未来发展可能会受到挑战。但如果豆包能够继续深化其在特定领域或地区的技术和应用优势,并与其他企业或机构建立合作关系,它有可能在该领域或地区取得领先地位。另外,如果豆包能够持续投入研发,跟上技术发展的步伐,并扩大其模型和数据的规模,它也有可能成为一个更具竞争力的通用模型。

赞助本站

© 版权声明

相关文章

暂无评论

暂无评论...