DeepSeek-V3的成功引发了关于算力、大模型训练方式的大讨论。一些业内人士甚至担心,行业对算力的需求可能会大幅下降。但也有观点认为,DeepSeek的成功反而会进一步加大投入,推动更多的中小型企业入局。科技媒体Maginative的创始人兼主编Chris McKay评论称,DeepSeek-V3代表了一种潜在的范式转变,表明通过巧妙的工程和高效的训练方法,可能无须以前认为必需的庞大计算资源,就能实现人工智能的前沿能力。
随着大模型应用场景的不断拓展,对推理算力的需求也在不断攀升。以豆包大模型为例,其将带来巨大的推理端算力需求。海外科技巨头也在大手笔加大资本开支,预计2025年的资本开支可能高达3000亿美元。随着端侧AI放量,豆包、ChatGPT等AI应用的快速发展,算力需求将加速从预训练向推理侧倾斜,推理有望接力训练,成为下一阶段算力需求的主要驱动力。
DeepSeek的成功,不仅为国内其他企业带来了启发,也推动了整个行业的技术进步。梁文锋表示:“过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。”
DeepSeek的出现,让我们看到了中国在人工智能领域的巨大潜力和创新能力。