找回密码
 注册
查看: 669|回复: 0

大模型目前主要处理文字模型算法、视觉网络算法,过度放大需要慎重思考

[复制链接]

大模型目前主要处理文字模型算法、视觉网络算法,过度放大需要慎重思考

[复制链接]

107

主题

7

回帖

599

积分

管理员

积分
599
admin

107

主题

7

回帖

599

积分

管理员

积分
599
2024-10-22 | 显示全部楼层 |阅读模式
5dfd9617-a0c6-4c13-80b8-00706d88c736.jpg
大模型全称是大型语言模型(LLM,Large Language Model),这里的“大”主要指模型结构容量大,模型结构中的参数多,用于预训练这个大模型的数据量大。

也就是大模型的三个层次:算法(模型结构)、模型参数(数量和数值)、训练数据。

所以大模型擅长主要是是处理语言方面的问题,如语音识别、自动翻译、聊天机器人等等。

也有人将神经网络视觉算法(图片、视频处理等)也归为大模型,被称为视觉大模型或多模态大模型。

但是不管怎么说,目前的大模型的应用领域并不算多,我们不应该“妖魔化”大模型,而是应该积极探索可能的应用场景。

您需要登录后才可以回帖 登录 | 注册

本版积分规则

BPM文库 | 鲁ICP备2023002758号

GMT+8, 2025-4-11 20:31 , Processed in 0.062834 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复