我们看到ChatGPT也好,还是上面提到的绝商汤影智舱、智驾也好,他们本身都是AI进行训练后一个产品输出。AI本身是需要数据、模型、算力,三者不间断的进行投喂运算,才能获得能力的增长。
所以不管是智能座舱内的语音、图像识别、追踪,还是智能驾驶能力的进步,全部要依赖数据的反复训练,才能变得更加聪明、更加无人。
现在的问题是,数据的收录入口异常丰富,比如我们车舱内有众多麦克风、摄像头、按键都可以输入数据,而辅助驾驶也有摄像头、毫米波雷达甚至是激光雷达收集数据,但怎么把这些数据善加利用训练好,看的就是模型与算力了。
用商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚的话说就是:“优秀的大模型,就像非常有天赋的运动员”,这个时候教练只需要进行方法论的输出还有一些引导,勤奋的且有天赋的运动员很快就能来到一个夸张的水平。
商汤的大模型极度夸张,在计算机视觉方面已经成功研发了320亿参数量通用视觉模型,所以这个定语是“全球最大”!
基于这个有些变态的超大模型,商汤可以实现高性能的目标检测、图像分割和多物体识别算法,主要可以应用在自动驾驶、工业质检、医疗影像等方向。
商汤在多模态多任务领域,发布了拥有30亿参数的通用大模型“书生(INTERN)2.5”。是目前全球开源模型中ImageNet准确度最高、规模最大,同时也是物体检测标杆数据集COCO中唯一超过65.0 mAP的模型。
针对AIGC、语音识别和合成商汤都针对性的开发了大模型,在自然语言处理领域甚至安排了千亿参数量预训练大模型。
在4月10日发布的“商汤日日新SenseNova”大模型带来了全新的思路,徐立把它比喻成是一个“模型超市”,有数据、模型训练以及部署的三位一体的飞轮,能够完成自然语言的生成工具、图片生成的服务工具,所有的感知类任务的工具,以及模型的增量研发、服务工具。讲人话就是,这个商汤日日新SenseNova超大模型,可以自己产生越来越多大模型!
原文链接:https://baijiahao.baidu.com/s?id=1763436150667148639&wfr=spider&for=pc