#
写在DeepSeek爆火之后:AI发展得如此之快,未来会越来越快吗?
发布时间:2025-03-16 08:30:12

出品:

作者:王琛(中国科学院计算技术研究所在读博士)

监制:中国科普博览

编者按:为展现智能科技动态,前沿科技项目推出“人工智能”系列文章,一窥人工智能前沿进展,回应种种关切与好奇。让我们共同探究,迎接智能时代。

最近,DeepSeek作为AI界一位“新顶流”,凭借强大的功能在社交媒体上引发热议。有人说它是未来的生产力工具,有人好奇它能为生活带来哪些改变,也(yě)有(yǒu)人(rén)担(dān)心(xīn)它(tā)会(huì)抢(qiǎng)走(zǒu)自(zì)己(jǐ)的(de)饭(fàn)碗(wǎn)……

为(wèi)了(le)让(ràng)大(dà)家(jiā)更(gèng)加(jiā)了(le)解(jiě)这(zhè)个(gè)备(bèi)受(shòu)关注(zhù)的(de)智(zhì)能(néng)帮(bāng)手(shǒu),我(wǒ)们(men)邀(yāo)请(qǐng)了(le)中(zhōng)国(guó)科(kē)学(xué)院(yuàn)计(jì)算(suàn)技(jì)术(shù)研(yán)究(jiū)所(suǒ)在(zài)读(dú)博(bó)士(shì)王(wáng)琛,用10个问题全面解答关于DeepSeek的核心原理、使用技巧以及未来趋势等疑问。无论是AI小白还是科技达人,这篇文章都能为你答疑解惑!让我们一起看看,这个“智能帮手(shǒu)”能(néng)否(fǒu)成(chéng)为(wèi)我(wǒ)们生活中(zhōng)的(de)真(zhēn)正(zhèng)伙(huǒ)伴(bàn)吧(ba)!

DeepSeek在春节期间受到全球的关注,现在许多平台都表示已经接入DeepSeek大模型,它究竟是什么?

DeepSeek是一家位于杭州的人工智能初创公司,由幻方量化联合创始人(rén)梁(liáng)文峰(fēng)于(yú)2023年7月创立,专注于大语言模型的研发(fā)。

在(zài)春(chūn)节前,DeepSeek相继发布了两款同名的开源大语言模型:DeepSeek-V3(2024年12月26日)和DeepSeek-R1(2025年1月20日)。它们的性能可以与OpenAI的闭源模型GPT-4o和o1等其它大语言模型相媲美,且成本明显低于其它模型。

DeepSeek-V3模型旨在提供高性价比的服务,能够快速地响应用户的需求,满足自然语言处理、问答翻译、内容生成等日常任务的需求。DeepSeek-R1模型专注于复杂的推理任务,特别是在数学问题、代码生成、逻辑推理等领域具有更强的能力,但响应时间也相对较长。

DeepSeek为什么会受到如此大的关注?

DeepSeek-V3和DeepSeek-R1在春节前发布后,凭借其与OpenAI为首的顶尖大模型相当的性能以及低廉的训练成本和推理费用,迅速引发了全球的广泛关注。DeepSeek的高性价比挑战了美国大模型的垄断地位,它的推出使得更多企(qǐ)业(yè)和(hé)用(yòng)户(hù)能(néng)够(gòu)以(yǐ)更(gèng)低(dī)的(de)价(jià)格(gé)体(tǐ)验(yàn)到(dào)最(zuì)先(xiān)进(jìn)的(de)AI成(chéng)果(guǒ)。

DeepSeek开(kāi)源(yuán)了(le)其(qí)技(jì)术(shù)细(xì)节(jié)和(hé)模(mó)型(xíng)权(quán)重(zhòng),使(shǐ)得(de)更(gèng)多(duō)人(rén)能(néng)够(gòu)利(lì)用(yòng)其(qí)成(chéng)果(guǒ)进(jìn)行(xíng)创(chuàng)新(xīn)和(hé)研(yán)发(fā)。与(yǔ)此(cǐ)同时,DeepSeek还免费开放了在线服务,吸引了大量用户体验,形成了前所未有的热潮。在DeepSeek-R1正式发布7天后,DeepSeek超越ChatGPT登上了AppStore免费应用下载排行榜的榜首。DeepSeek的成功标志着中国在AI领域的重大进展,提升了中国在全球AI技术竞争中的地位。目前,多个企业和高校已经开始自主部署DeepSeek模型,进一步证明了它的广泛应用潜力。

它为什么能用这么(me)低(dī)的(de)成(chéng)本(běn)、这(zhè)么(me)有(yǒu)限(xiàn)的(de)算(suàn)法(fǎ)实(shí)现(xiàn)这(zhè)么(me)强(qiáng)大(dà)的(de)能(néng)力(lì)?是(shì)只(zhǐ)在(zài)中(zhōng)文表(biǎo)达(dá)上(shàng)强(qiáng)大(dà),还(hái)是(shì)各(gè)种(zhǒng)性(xìng)能(néng)都(dōu)还(hái)不(bù)错(cuò)?

DeepSeek能(néng)够(gòu)以(yǐ)较(jiào)低(dī)的(de)训(xun)练(liàn)成(chéng)本(běn)实(shí)现(xiàn)强大的能力,主要得益于DeepSeek长期以来在模型架构和算法层面的持续创新。

具体来说,DeepSeek通过使用混合专家架构(MoE)和多头潜在注意力(MLA)等技术有效降低了推理成本。同时,借助数据蒸馏、分布式训练优化、以及硬件层面的精细调优,DeepSeek进一步提升了资源利用率,从而降低了训练成本。多种创新的优化技术的融合使得DeepSeek在仅拥有较低的训练和推理成本的同时,能够提供强大的性能。

在中文的理解和应用方面,DeepSeek有着突出的表现,它不仅能够理解(jiě)古(gǔ)文,创(chuàng)作(zuò)诗(shī)词,还能准确掌握时下流行的网络用语。而相比之下,ChatGPT的中文虽然语法通顺,却显得较为生硬。不过,DeepSeek的强大能力并不仅限于中文表达,在官方公布的多项标准评测中,DeepSeek在英文、百(bǎi)科(kē)知(zhī)识(shi)、长(zhǎng)文本(běn)、代(dài)码(mǎ)、数(shù)学(xué)能(néng)力(lì)等(děng)领(lǐng)域均(jūn)达(dá)到(dào)了(le)顶(dǐng)尖(jiān)水(shuǐ)平(píng)。

DeepSeek在(zài)不(bù)同(tóng)领(lǐng)域的(de)性(xìng)能(néng)表(biǎo)现

(图片来源:参考资料2)

在AI的范畴内,使用中文是否代表着更高的效率?

在AI领域,“效率”更高往往意味着处理速度更快,或(huò)者(zhě)理(lǐ)解(jiě)的(de)准(zhǔn)确性更高,或者生成的内容质量更好。

首先,中文和英文在结构上有很多不同。中文是表意文字,一个字可以表达很多意思,而英文是字母文字,每个单词由多个字母组成。中文相比英文在表达上更简洁、高效,信息密度更高。在表达相同的意思时,中文往往能更简洁地传达内容。因此在AI领域,使用中文可以提高表达效率,进而降低成本。

但同时,中文多样的语义和复杂的语法结构也对AI的理解能力提出了挑战。比如,在中文中,“花”可以是植物,也可以是花费,这可能让AI在理解上下文时更难。而英文虽然也有同义词和多义词的问题,但结构上可能更清晰一些。所以,处理中文的时候,AI需要更多的上下文信息来准确理解意思。

此外,数据量和模型的设计与优化也应当纳入考虑范围。如果AI模型在训练时使用了大量的中文数据,那么它可能在处理中文任务时表现更(gèng)好(hǎo)。反(fǎn)过(guò)来(lái),如(rú)果(guǒ)数(shù)据(jù)主要(yào)来(lái)自(zì)英(yīng)文或(huò)者(zhě)其(qí)他(tā)语(yǔ)言(yán),那(nà)么(me)AI在(zài)处(chù)理(lǐ)这(zhè)些(xiē)语(yǔ)言(yán)的(de)时(shí)候(hou)效(xiào)率(lǜ)可(kě)能(néng)会(huì)更(gèng)高(gāo)。某(mǒu)些(xiē)模(mó)型(xíng)可(kě)能(néng)是(shì)专(zhuān)门(mén)为(wèi)某(mǒu)种(zhǒng)语(yǔ)言(yán)而(ér)设(shè)计(jì)的(de),在(zài)这(zhè)种(zhǒng)情(qíng)况(kuàng)下(xià),在(zài)该(gāi)语(yǔ)言(yán)上(shàng)的(de)效(xiào)率(lǜ)自(zì)然(rán)就(jiù)会(huì)更(gèng)高(gāo)。

关于(yú)中(zhōng)文在(zài)AI领(lǐng)域是(shì)否(fǒu)具(jù)有(yǒu)显(xiǎn)著(zhe)的(de)优势,目前尚无定论(lùn),未(wèi)来(lái)如(rú)何(hé)挖(wā)掘(jué)中(zhōng)文的(de)潜(qián)在(zài)优(yōu)势(shì)可(kě)能(néng)将(jiāng)成(chéng)为(wèi)重(zhòng)要(yào)的(de)研(yán)究(jiū)方(fāng)向(xiàng)。

为(wèi)什(shén)么(me)在(zài)回(huí)答(dá)用(yòng)户(hù)问(wèn)题(tí)的(de)时(shí)候(hou),DeepSeek可(kě)以(yǐ)展(zhǎn)示(shì)其(qí)“深(shēn)度(dù)思(sī)考(kǎo)过(guò)程(chéng)”?

DeepSeek-R1在(zài)回(huí)答(dá)用(yòng)户(hù)问(wèn)题(tí)时(shí)可(kě)以(yǐ)展(zhǎn)示(shì)其(qí)深(shēn)度(dù)思(sī)考(kǎo)过(guò)程(chéng)是(shì)因(yīn)为(wèi)它(tā)使(shǐ)用(yòng)了(le)思(sī)维(wéi)链(liàn)(Chain of Thought, CoT)技(jì)术(shù)。思(sī)维(wéi)链(liàn)技(jì)术(shù)模(mó)仿(fǎng)人(rén)类(lèi)的(de)思(sī)考(kǎo)方(fāng)式(shì),它(tā)要(yào)求(qiú)模(mó)型(xíng)将(jiāng)复(fù)杂(zá)任(rèn)务(wu)分(fēn)解(jiě)成(chéng)简(jiǎn)单(dān)步(bù)骤(zhòu)然(rán)后(hòu)再(zài)逐(zhú)步(bù)解(jiě)决(jué),从(cóng)而(ér)增(zēng)强(qiáng)模(mó)型(xíng)在(zài)复(fù)杂(zá)推(tuī)理(lǐ)任(rèn)务(wu)中(zhōng)的(de)能(néng)力(lì)。

OpenAI的(de)o系(xì)列(liè)模(mó)型(xíng)也(yě)使用了思维链技术,但OpenAI并未向用户公开模型的原始思维链,而是仅提供了一个思维链的总结。而DeepSeek-R1作为开源模型,则完全开放了思维链,用户可以清晰地看到模型在解(jiě)决(jué)问(wèn)题(tí)时(shí)的(de)全部(bù)推(tuī)理(lǐ)过(guò)程(chéng)。

ChatGPT与(yǔ)DeepSeek分(fēn)别(bié)有(yǒu)哪(nǎ)些(xiē)特(tè)点(diǎn)?它(tā)们(men)是(shì)否(fǒu)代表AI大模型以后的两种发展方向(xiàng),还(hái)是(shì)会(huì)融(róng)合(hé)发展?

ChatGPT基于OpenAI的GPT系列模型,使用了大量多语言数据进行训练,支持多语言、多模态,能够跨语言和跨领域提供服务。作为闭源模型,它由OpenAI为用户提供在线服务。

DeepSeek则在中文领域进行了优化,拥有较低的训练和推理成本。DeepSeek是开源模型,用户可以根据需要自行部署并进行定制化修改。目前它们的技术架构和市场定位都有所不同,但随着技术的发展,未来可能会出现更多相互借鉴融合的趋势,例如DeepSeek可能会借鉴ChatGPT的多模态能力,ChatGPT也可能会优化其本地化服务以应对DeepSeek等竞争对手的挑战。

DeepSeek发布的是开源模型,开源以后,后面应当如何保持领先?

DeepSeek的创始人梁文锋表示,现在的生成式人工智能并不是终点,未来的目标是朝(cháo)着(zhe)实(shí)现(xiàn)通(tōng)用(yòng)人(rén)工(gōng)智(zhì)能(néng)迈(mài)进(jìn)。在(zài)AI技(jì)术(shù)快(kuài)速(sù)发(fā)展(zhǎn)的(de)当(dāng)下(xià),大(dà)家(jiā)都(dōu)没(méi)有(yǒu)碾(niǎn)压(yā)对(duì)手(shǒu)的(de)技(jì)术(shù)优(yōu)势(shì),即(jí)使(shǐ)闭(bì)源(yuán)也(yě)无(wú)法(fǎ)阻(zǔ)止(zhǐ)被(bèi)别(bié)人(rén)赶(gǎn)超(chāo)。为(wèi)了(le)应(yīng)对(duì)这(zhè)一(yī)挑(tiāo)战(zhàn),他(tā)们(men)希(xī)望将价值沉淀在团队的成长之中,通过持续的创新来保持领先(xiān)。开(kāi)源(yuán)的(de)决(jué)策(cè)正(zhèng)是(shì)基(jī)于这一考量,开源可以打破技术垄断,降低技术门槛,激发更广泛的技术合作与创新。开源能够吸引更多的开发者共同参与贡献,构建一个开放与多元化的技术发展环境。DeepSeek希望通过这种方式推动技术的长远发展,保持领先地位,成为AI技术的引领者。

打开使用页面,有“深度思考(R1)”和“联网搜索”选项,二者在使用上有何区别?如何能更好地使用这种推(tuī)理(lǐ)型(xíng)大(dà)模(mó)型(xíng)?

打(dǎ)开(kāi)深(shēn)度(dù)思(sī)考(kǎo)(R1)选(xuǎn)项(xiàng)后(hòu),后(hòu)台(tái)会(huì)切(qiè)换(huàn)到(dào)DeepSeek-R1模(mó)型(xíng),这(zhè)个(gè)模(mó)型(xíng)专(zhuān)注(zhù)于(yú)需(xū)要(yào)复(fù)杂(zá)推(tuī)理(lǐ)的(de)场(chǎng)景(jǐng),如(rú)数(shù)学(xué)或(huò)编(biān)程(chéng)方(fāng)面(miàn)的(de)问(wèn)题(tí)。它(tā)能(néng)够(gòu)展(zhǎn)示(shì)详(xiáng)细(xì)的(de)思(sī)维(wéi)过(guò)程(chéng),提(tí)供(gōng)推(tuī)理(lǐ)步(bù)骤(zhòu)与(yǔ)最(zuì)终(zhōng)结(jié)果(guǒ)。

联(lián)网(wǎng)搜(sōu)索(suǒ)选(xuǎn)项(xiàng)则(zé)允(yǔn)许(xǔ)模(mó)型(xíng)获(huò)取(qǔ)实(shí)时(shí)互(hù)联(lián)网搜索的结果,适用于(yú)时(shí)效(xiào)性(xìng)较(jiào)强(qiáng)、需(xū)要(yào)获(huò)取(qǔ)最(zuì)新(xīn)信(xìn)息(xi)的(de)问(wèn)题(tí),模(mó)型(xíng)可以根据搜索结果提供实时更新的答案。

在使用深度思考(R1)功能时,在提问中用户无需额外引导模型进行思考,只需要明确表达自己的需求,避免模糊不清的表述,以便模型更好地理解并提供准确的答案。在深度思考模式下,除了模型的最终答案外,用户还可以关注模型给出的思考过程,从而更好地掌握解决问题的详细方法。

哪些领域的工作受到DeepSeek的可能冲击最大,甚至能被取代?

DeepSeek等大语言模型可能会对那些依赖信息检索、数据分析、重复性高且(qiě)目(mù)标(biāo)明(míng)确(què)的行业产生冲击。例如内容创作、数据处理、翻译校对、人工(gōng)客(kè)服(fú)、人(rén)力(lì)资(zī)源(yuán)管(guǎn)理(lǐ)和(hé)财(cái)务(wu)审(shěn)计(jì)等(děng)领(lǐng)域,可(kě)能(néng)会(huì)被(bèi)自(zì)动(dòng)化(huà)的(de)AI技(jì)术(shù)所(suǒ)替(tì)代(dài)。AI可(kě)以(yǐ)高(gāo)效(xiào)地(de)完成用户需求的任务,从而减少对人工的依赖。

然而,对于一些需要创造性、情感智力和人际沟通的工作来说,人工的参与仍然不可或缺。在AI技(jì)术(shù)飞(fēi)速(sù)发(fā)展(zhǎn)的(de)当(dāng)下(xià),人(rén)们(men)需(xū)要(yào)不(bù)断(duàn)提(tí)升(shēng)这(zhè)些(xiē)难(nán)以(yǐ)被(bèi)AI轻(qīng)易(yì)替(tì)代(dài)的(de)能(néng)力(lì)。这(zhè)些(xiē)能(néng)力(lì)可(kě)以(yǐ)帮(bāng)助(zhù)个(gè)人(rén)在职场中保持竞争力,确保在未来的工(gōng)作(zuò)环(huán)境中,人与AI能实现更好的协作和互补,共同推动(dòng)社(shè)会(huì)进(jìn)步(bù)。

AI发(fā)展的速度怎么这么快?会越来越快吗?

AI在过去几年中迅速发展,这得益于多个因素的推动。

首先,计算能力的大幅提升,尤其是GPU等(děng)硬件技术的发展,使得AI模型能够处理更大规模的数据(jù),训(xun)练(liàn)出(chū)更复杂的模型,从而提升了整体性能。

其次,互联网技术的飞速发展为AI训练提供了丰富的数据库。同时,深度学习领域算法架构的突破,也使得AI的能力不断增强。近年来,科技公司和投资者纷纷看到了AI的潜力,并在资金和技术上给予了大力支持,这些因素共同促进了AI技术的飞跃发展。

虽然许多专家认为AI将在未来继续快速发展,但是否能够保持当前的速度仍然存在不确定性。乐观者认为,AI的进步将会呈现指数爆炸的趋势,随着AI智能的增长,AI迭代的速度将会越来越快,最终完全超越人类。然而,算力和数据可能会成为制约AI技术发展的瓶颈,大型模型的训练需要越来(lái)越(yuè)多(duō)的(de)算(suàn)力(lì),而(ér)计(jì)算(suàn)能(néng)力(lì)的(de)发(fā)展(zhǎn)目(mù)前(qián)已(yǐ)经(jīng)不(bù)足(zú)以(yǐ)完(wán)全满(mǎn)足(zú)AI训(xun)练(liàn)的(de)需(xū)求(qiú)。同(tóng)时(shí),人(rén)类(lèi)现(xiàn)有(yǒu)的(de)数(shù)据(jù)在(zài)未(wèi)来(lái)几(jǐ)年(nián)内(nèi)可(kě)能(néng)会(huì)被(bèi)耗(hào)尽(jǐn)。

未(wèi)来(lái)AI技(jì)术(shù)如(rú)何(hé)突(tū)破(pò)算(suàn)力(lì)和(hé)数(shù)据(jù)的(de)瓶(píng)颈(jǐng),继(jì)续(xù)飞(fēi)速(sù)发(fā)展(zhǎn),仍(réng)然(rán)需(xū)要(yào)全世(shì)界(jiè)科(kē)研(yán)人(rén)员(yuán)的(de)共(gòng)同(tóng)努(nǔ)力(lì)。此(cǐ)外(wài),AI可能引发的伦理、法律与社会问题也逐渐引起了人们的担忧,一些科学家已经呼吁暂停开发更强大的AI系统,直至人们可以确保其安全性和可控性。

参考资料:

1.https://en.wikipedia.org/wiki/DeepSeek

2.https://api-docs.deepseek.com/zh-cn/news/news1226

3.https://api-docs.deepseek.com/zh-cn/news/news250120

4.Liu, A., Feng, B., Xue, B., Wang, B., Wu, B., Lu, C., ... & Piao, Y. (2024). Deepseek-v3 technical report. arXiv preprint arXiv:2412.19437.

5.Guo, D., Yang, D., Zhang, H., Song, J., Zhang, R., Xu, R., ... & He, Y. (2025). Deepseek-r1: Incentivizing reasoning capability in llms via reinforcement learning. arXiv preprint arXiv:2501.12948.

  • 上一篇
  • 新闻中心-
  • 下一篇

联系我们

请致电咨询

400 882 6599 400 686 5686