2025-12-09 | 
旅管家小编 | 文章来源:
中国旅游报
| 行业新闻
【摘要】2025年8月,国务院印发了《关于深入实施“人工智能+”行动的意见》,针对“加强数据供给创新”,提出“以应用为导向,持续加强人工智能高质量数据集建设”要求。
2025年8月,国务院印发了《关于深入实施“人工智能+”行动的意见》,针对“加强数据供给创新”,提出“以应用为导向,持续加强人工智能高质量数据集建设”要求。各行业各领域加快推进落实,在高质量数据集建设方面形成了一批典型案例。对于文化和旅游行业来说,加快建设高质量数据集是推动“人工智能+”行动的基础性工作,是推动人工智能技术赋能文化和旅游高质量发展的战略性要求,是“十五五”时期为文化和旅游高质量发展夯实基础的前瞻性举措,要客观认识已有基础、科学把握建设原则、系统谋划建设路径,切实加以推进。
客观认识已有基础
建设文化和旅游行业高质量数据集已具备一定的认识基础、制度基础和实践基础。
一是认识基础。各界在高质量数据集的概念、意义和存在问题方面,已形成基本共识。
高质量数据集,是指经过采集、加工等数据处理,可直接用于开发和训练人工智能模型,能有效提升模型表现的数据的集合。
高质量数据集的作用和意义在多个维度得到了确认。从技术维度看,高质量数据集是人工智能大模型训练、推理和验证的关键基础,数据集质量直接影响人工智能的“智商”水平,是人工智能真正的“护城河”。从经济维度看,高质量数据集可以创造直接经济价值、培育产业新动能,是构建企业差异化竞争力的核心要素,是驱动数字经济发展的核心引擎。从社会治理维度看,高质量数据集有利于提升公共服务效能,提升现代化治理能力。从安全维度看,高质量数据集是构筑国家核心竞争力的关键要素和维护国家安全的重要屏障,对于维护国家意识形态安全和文化安全具有战略意义。总体来看,高质量数据集已成为战略基础设施和国家数字竞争力的核心支柱之一。
高质量数据集建设存在的瓶颈问题,主要表现在数据供给、技术能力、综合治理、商业模式等方面。数据供给方面,存在数据孤岛与开放困境。跨部门、跨地区数据共享机制不健全,授权运营平台覆盖不足,高质量语料面临枯竭风险,特别是中文数据集原始数据资源匮乏,开源数据集也较少,制约了大模型创新发展和应用落地。技术能力方面,多模态数据处理能力不足,自动化清洗、智能化标注工具成熟度低,仍依赖传统统计方法。综合治理方面,数据权属规则不明晰,数据脱敏等技术规模化应用滞后,数据安全保障制度和规则需进一步加强。商业模式方面,数据交易所尚未形成规模化交易市场,投入产出比例失衡,价值转化周期长,商业生态还不成熟。
二是制度基础。从国家层面到文化和旅游行业层面,高质量数据集建设的体制、政策和标准体系正加快构建。
体制保障方面,国家数据局成立,召开高质量数据集建设工作启动会,建立跨部门协同机制。成立国家数据发展研究院,建立全国数据标准化技术委员会、人工智能标准化技术委员会等专业技术组织。
政策支撑方面,《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》《国务院关于深入实施“人工智能+”行动的意见》《“数据要素×”三年行动计划(2024—2026年)》《国家发展改革委等部门关于促进数据产业高质量发展的指导意见》《国家发展改革委等部门关于促进数据标注产业高质量发展的实施意见》《国家数据基础设施建设指引》等一系列重要文件从政策法规保障、标准化建设、安全合规、生态协作、场景落地等方面,为高质量数据集建设提供了顶层设计。
标准体系方面,2025年8月,全国数据标准化技术委员会以技术文件形式正式发布《高质量数据集 建设指南》《高质量数据集 格式要求》《高质量数据集 分类指南》《高质量数据集 质量评测规范》等标准。文化和旅游领域现行有效且与数据相关的标准涉及图书馆、美术馆、非遗、动漫、视频资源、旅游基础信息等多个领域,为行业高质量数据集建设提供了数据分类规范。
三是实践基础。文化和旅游行业高质量数据集建设先行先试、典型案例和交易撮合正同步开展。
先行先试方面,2025年8月,国家数据局启动高质量数据集建设先行先试工作,首批先行先试数据集共140个,其中,文化旅游领域10个,涉及演艺(上海戏剧学院:AI赋能艺术人才培养和演艺行业发展高质量数据集)、戏曲(中国戏曲学院:中国戏曲高质量多模态数据集建设)、文博(中国国家博物馆:中国国家博物馆高质量数据集建设)、游客监测(联通数据智能有限公司:旅游综合数据与游客监测高质量数据集)、在线旅游(携程:整合多元数据的在线旅游高质量数据集建设)、景区(福建票付通信息科技有限公司:旅游景区及游客高质量数据集)、文旅视听(云南广播电视台:云南南亚东南亚文化旅游视听高质量数据集建设)等多个领域。
典型案例方面,国家数据局公布了三批“数据要素×”典型案例。其中,文化和旅游领域涉及文物传承与保护、非遗创造性转化与创新性发展、旅游目的地影响力提升、旅游新体验、文旅产业转型升级、数字文化产业生态等方面,依托数据资源整合应用(包括高质量数据集),解决实际问题并创造经济效益和社会效益。典型案例的成功实践也推动着更高质量、更标准化的数据集的产生和流通。部分高质量数据集已取得初步成效,如山东省打造“数据驱动海洋旅游联合运营”样板,带动海上旅游产品、游客量、营收大幅增长;重庆市依托多源数据构建三峡旅游线路智能优化模型,实现了客流精准预测和线路动态调整,游客满意度显著提升。
交易撮合方面,在11月举办的2025全国高质量数据集和数据标注产业供需对接大会上,103家文旅企业参与了开放式供需洽谈,为推动文化和旅游行业高质量数据集实现市场交易提供了参考。
科学把握建设原则
推进文化和旅游行业高质量数据集建设,要把握好以下原则。
一是把握阶段性特征。当前,高质量数据集建设的政策(标准)驱动与场景牵引同步发力、协同推进,体制机制不断完善,高质量数据集建设进入系统化、规模化推进阶段。但文化和旅游行业对理论和政策的研究相对滞后,标准和政策支撑不足,有效场景需求尚未形成系统牵引力,系统性推进思路不明确,整体仍处于起步阶段。
二是融入建设大局。目前,高质量数据集建设重点关注场景牵引作用、建设方法总结、质量检测工作、培育市场共识与机制、推动工程化与设施化、形成协同推进合力等方面。文化和旅游行业应在高质量数据集建设的宏观政策背景下,与政策导向和已有标准有机衔接,充分融入建设大局,同向同步推动建设进程。
三是突出行业特性。文化和旅游领域业态丰富、类别多样,新业态快速涌现,发展程度各异,意识形态风险与安全生产风险并存。文化和旅游是服务业的重要组成部分,具有服务业的运行逻辑和市场规律。在建设进程中,要突出服务业的特性,坚持社会效益优先,社会效益与经济效益相统一。
四是坚持需求牵引。建设文化和旅游行业高质量数据集不能一哄而上,要因地制宜,坚持需求牵引,依据行业不同细分领域对高质量数据集的需求层次化和专业化特征、紧急程度以及有效场景(生产场景、工作场景、生活场景)建设需求等,有序开展建设。
五是坚持分级分类。要按照功能类别、建设主体、已有基础等,分级分类开展建设。在公共服务领域,由行政部门主导,挖掘整合部门已有数据资源,围绕满足高质量公共服务现实需求开展建设。在市场领域,充分发挥经营主体的积极性,由经营主体主导建设并参与市场竞争。鼓励行业组织依托自身数据资源优势,开展高质量数据集建设。
六是坚持系统思维。要将高质量数据集建设作为一项系统工程加以推进,加强顶层设计,做好前瞻规划,以体系化思维优化高质量数据集建设布局。加强制度支撑和基础设施建设,促进高质量数据集流通利用,构建覆盖全流程、贯通各环节的高质量数据集建设格局。
系统谋划建设路径
一是加强理论研究。要深入研究阐释建设高质量数据集对落实《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》精神、推动文化和旅游高质量发展的基础性、战略性意义和时代价值。开展覆盖全行业的高质量数据集建设调研,进一步明确建设需求、定位、方向和重点。
二是加强通识教育。要将高质量数据集专业培训纳入文化和旅游“十五五”规划,编制文化和旅游行业高质量数据集建设通识读本,开展案例教学,不断提升从业人员数字素养和数据意识,加强复合型人才培养,凝聚行业共识和发展合力。
三是健全标准规范。加强已有数据标准宣传贯彻,进一步夯实数据基础。着眼于高质量数据集建设全流程,研究出台符合应用场景需求、行业特征鲜明的数据标准与技术标准。建立高质量数据集多维质量评价体系,提升数据集建设成效。
四是推动数据共享。依据相关法律法规,完善数据共享机制,探索创新文化和旅游行业数据要素“三权分置”(数据资源持有权、加工使用权、产品经营权)新模式,推动数据共享拓宽拓深。创新数据资源整合机制,有效整合景区、酒店、OTA平台、文博场馆、院团等多源数据,明确数据流通边界,提升数据归集效能。探索建立政务数据授权运营模式,提升各类主体参与高质量数据集建设的积极性。
五是推动供需对接。加强行业引导,针对场景需求和数据集供给对接难问题,探索建立文化和旅游行业高质量数据集建设供需对接平台,倡导高质量数据集建设与运营同步考虑理念,支持场景需求方、技术服务商、数据资源方等多方主体合力深化数据价值挖掘与场景应用。
六是加强政策保障。适时出台文化和旅游行业高质量数据集建设实施方案,明确基本思路,系统部署重点任务,为经营主体按需建设高质量数据集提供政策支撑,培育行业数据服务商,构建行业数据生态,推动“人工智能+”落地落实,不断提升行政效能,赋能企业创新发展。
加快建设文化和旅游行业高质量数据集是时代命题,是一项具有基础性、战略性、前瞻性的系统工程,有利于进一步拓展文化和旅游消费场景,助力打造更有品质的美好生活,与《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》中关于文化和旅游的要求一脉相承,需要全行业深化认识,增强合力,系统推进。