“随着人工智能的发展,高质量的行业通识和行业专识数据集将决定大模型能力的上限。同时,中国智能算力的发展应兼顾提升先进制程良品率,以及打造全国统一的异构算力软件开发平台,建立起中国的类CUDA系统。”
2月1日,在2026年上海两会期间,上海政协委员、上海熠知电子科技有限公司董事长黄海清接受澎湃新闻记者采访时指出,高质量的数据集对于高效能智算非常重要。例如,50T的高质量数据集,对模型的能力提升会远远大过500个T低质量数据集的价值。且高质量数据能大幅降低算力依赖,50个T的高质量数据集用百卡就能完成训练,低质量数据却可能需要千卡集群。
黄海清此前曾担任语料运营企业上海库帕思科技有限公司CEO以及阿里云中国区的总裁。

黄海清在采访中强调每个人要应积极拥抱大模型,“没有大模型和人工智能思维的同仁们,就是新时代的文盲,大模型革命的影响力将远超互联网革命”。
黄海清建议,每个人可以在手机中安装3-4个AI工具APP,如DeepSeek、通义千问、Kimi、豆包等,在工作和生活中多尝试、多对比,选择最适合自己的工具提升效率,“用好这些工具的关键,在于掌握提示词的使用技巧。优秀的提示词呈现‘五化’,即指令明确化、背景具象化、约束清晰化、角色前置化、交互递进化,以此让AI为普通用户提供实用的学习方向。”
值得注意的是,近期,AI幻觉、虚假生成问题成为人工智能规模化应用的突出风险,大模型易凭空编造、输出失实信息,在医疗、法律、金融等领域引发决策失误、司法干扰等问题,甚至出现伪造证据、制造虚假侵权的情况。
为什么AI会说胡话?黄海清向澎湃新闻指出,原因之一在于数据不够高质量。提高语料数据集的质量,除了通过基础方法论优化外,核心是要建设评测数据集。只有建立明确的质量标准,如完整性、及时性等,才能科学界定和验证数据的质量。
黄海清还指出,AI说胡话的另一个原因可能是“算法歧视”,建议通过国家法律政策规范与大模型企业道德伦理自律、监督考核相结合的方式,筑牢AI合规发展的底线,确保模型输出内容的正确性和可信性。
在人工智能加速融入教育领域的背景下,青少年如何合理使用AI工具也成为社会关注的焦点。针对青少年借助AI辅助学习可能产生依赖的问题,黄海清在采访中指出,“中小学生怎么用大模型来提高学习效率,教育垂类大模型已能提供很大的支持,例如能为学生提供解题步骤解析。但这是一把双刃剑,过度依赖可能导致思考能力弱化。”
黄海清指出,在鼓励教育垂类大模型技术开发的同时,也要构建限制机制,通过智能监控和引导功能,让大模型在助力学习与培养独立思维间取得平衡。谈及人工智能课程进校园的实践,黄海清认为,课程设计需立足中小学生认知特点,既要融合最新技术趋势,更要做到深入浅出。优质课程应着重激发创造力,而非单纯技术灌输。
谈及备受关注的具身智能,黄海清在采访中指出,具身智能无疑是万亿级别的巨大市场,未来必将深刻改变人们的工作与生活方式。但当前其发展仍面临两大核心障碍:一是训练语料数据标准不统一,不同企业研发的产品在身高、感知设备等技术参数上差异显著,导致泛化能力不足;二是成本居高不下,限制了应用场景的拓展。
对此,黄海清建议,政府或行业协会牵头建立统一的语料共享标准,推动数据流通,避免重复建设造成的成本浪费;同时期待技术突破将具身智能相关产品成本降至10万元以内,激活更多应用需求。此外,黄海清也关注到具身智能对就业市场的影响,他提出,国家应加强技能培训,培育复合型人才,以应对单一工种被替代后的劳动力转型问题。
当前,国内迎来GPU企业上市热潮,黄海清向澎湃新闻记者指出,这是中国芯片集成电路创业者的重大利好,也标志着中国在全球AI竞争中与美国并肩前行。相信国内GPU企业未来可以赋能千行百业、助力大模型与垂类模型快速迭代,同时随着市场的技术迭代,未来有望推动中国科技力量走向东南亚、中东等全球市场。
同时,黄海清预判,算力发展将迎来重要转型,从预训练、训练为主的格局,逐步向推理方向演变,更好地支撑智能体与实际应用落地。
“在IT时代CPU是C位,而到了去年GPU是C位,相信未来异构融合算力将成为C位。”黄海清认为,GPU、CPU、ASIC等器件的协同生态,将成为算力发展的主流趋势。
人工智能是上海三大先导产业之一,已集聚了一批具备竞争力的国产GPU设计企业,硬件能力快速提升。黄海清介绍,例如上海芯片“四小龙”天数智芯、壁仞科技、沐曦股份、燧原科技等公司表现尤为突出。不过,中国迫切需要一个类似英伟达CUDA系统的通用计算软件平台,这需要政府发挥引导和牵引作用,通过成立联盟、构建生态,推动企业协同攻关,制定统一标准。
黄海清进一步指出,当前,GPU产业生态面临严峻挑战,以英伟达为代表的国际巨头,凭借其硬件与CUDA软件生态的深度绑定,构筑了垄断性闭环。据统计,全球95%的开发者和80%以上的大模型训练使用英伟达“CUDA”系统,我国在与之匹配的基础软件平台、开发生态和行业标准方面存在显著短板,已成为制约人工智能产业自主可控与创新发展的最大障碍。因此,打造中国版、国际一流的GPU通用计算软件平台(“华夏CUDA”),是保障技术安全、赢得竞争主动权的战略急需。
“上海在AI产业布局上已打下坚实基础,在算力的部署,在语料数据的构建,以及行业垂类模型的打造等方面都为产业发展提供了稳固支撑。”在黄海清看来,要在激烈竞争中持续领跑,上海仍需在关键领域精准发力。一方面,未来应将重点放在培育更多的行业垂类智能体和模型的独角兽上;其二,强化行业语料库的相关支持;第三,推动芯片产业协同发力。
澎湃新闻记者 邵冰燕 秦盛
https://finance.sina.com.cn/jjxw/2026-02-02/doc-inhkkqup1023661.shtml

