本文围绕羊城晚报报业集团研发的岭南文化大模型展开,介绍了该模型的发布背景、技术特点、优势以及对岭南文化传承发展的重要意义,同时阐述了羊城晚报未来在推动岭南文化数字化方面的规划。
在全球大模型技术全面深入各领域的当下,作为文化传播重要力量的羊城晚报,积极探索“技术 + 文化”的跨界融合模式,致力于为岭南地区绵延千年的文脉寻找独特的AI解法。
3月28日,一场聚焦于新基建高质量发展的盛会——岭南数字创意大厦新基建高质量发展大会,在充满创意氛围的羊城创意产业园盛大举行。在此次活动现场,由羊城晚报报业集团精心研发的国内首个文化领域多模态推理大模型——岭南文化大模型正式揭开神秘面纱,惊艳亮相。
据了解,岭南文化大模型以国产DeepSeek大模型作为坚实的技术基础。在此之上,它深度整合了《岭南文化辞典》《岭南文脉》等具有权威性的典籍,以及粤港澳三地丰富的文化资源。通过运用先进的知识蒸馏与多模态融合技术,构建起了一个智能化、系统化的岭南文化数字资产库。这一资产库的建成,能够实现岭南文化的永续保存、精准解析与创新转化,具有重大的文化价值和社会意义。
该模型的诞生,填补了区域特色文化大模型领域的空白
大模型作为人工智能领域的前沿技术高地,正以惊人的速度为各个行业赋能,同时也给文化的传承和发展带来了深刻的变革。
我国作为文化大国,拥有着极为丰富的文化资源。然而,当前“数字化率低、转化效能弱、国际传播难”等问题,依然是制约新时代文化创新发展的主要痛点。以广东为例,广东拥有粤剧、醒狮、广绣等165项国家级非遗项目,岭南文化资源十分丰富,但却面临着“有资源缺载体”的困境,文化数字化转化率较低。
岭南文化大模型的出现,为解决这一痛点提供了有效的途径。它能够推动文化资源向文化资产的转化。岭南文化大模型实验室主任邓立邦介绍说,岭南文化大模型将推动文化遗产保护从传统的“抢救式修复”向“创造性转化”转变。通过大模型技术,将那些散落的文化瑰宝转化为可编程、可交互、可流通的数字资产,为文化产业升级和数字经济发展注入新的活力。
“我们构建的训练语料库基于高维度异构数据源整合,涵盖了权威的岭南文化辞典、《羊城晚报》的文脉专题报道以及大量非结构化的音视频影像资料。这些资料形成了一个覆盖粤剧、舞狮、剪纸、陶艺、刺绣等多维度地方艺术形态与历史建筑信息的知识图谱。”邓立邦详细介绍道。
与通用大模型不同,岭南文化大模型在垂直领域的知识问答与创意内容生成方面表现更为出色。那么,如何让这个大模型既能理解脸谱的艺术内涵、听懂唱腔的韵味,又能跨越漫长的时间维度,深刻理解岭南文化的变迁呢?
在邓立邦看来,岭南文化大模型训练过程中面临的最大技术挑战,在于结构化与非结构化数据的深度融合算法优化。这一优化直接决定了模型的跨模态理解能力上限。
“在技术上,我们没有简单地调用通用模型,而是采用了‘独立训练 + 知识内化’的技术路径。我们借鉴古代师徒传艺的方式,设计了‘三阶段知识蒸馏’,实现了模型‘小而精’的技术突破。”邓立邦介绍说。通过运用多模态能力结合推理链条,借助稀疏门控路由,实现了从“单一”到“全感知”的拓展,让大模型不仅能谈论粤剧,还能“看懂”脸谱,“听懂”唱腔。
“我们期待通过AI与文化的深度融合,让鑊耳屋的砖瓦风情、粤剧水袖的飘逸灵动、早茶氤氲的市井气息……这些鲜活的岭南文化印记,在数字世界中重新焕发出勃勃生机。”邓立邦满怀期待地说。
作为深深扎根于岭南地区的文化大报,羊城晚报一直致力于推动岭南文化的传承与发展。岭南文化大模型的研发,正是羊城晚报以创新技术驱动岭南文化创新发展的重要举措。
根据规划,羊城晚报将顺应文化数字化发展的趋势,以岭南数字创意大厦为物理载体,建设岭南文化大数据中心,进一步开发岭南文化大模型,建立岭南文化传承发展实验室。通过这些举措,持续推动岭南文化的数字化保存、智能化解析和产业化应用,为岭南文化的创造性转化和创新性发展增添新的活力。
羊城晚报报业集团发布的岭南文化大模型。该模型以国产技术为基座,整合多方文化资源,填补了区域特色文化大模型空白,能有效解决文化数字化痛点。其在技术上有创新突破,在垂直领域表现出色。羊城晚报还规划了后续推动岭南文化数字化的系列举措,有望为岭南文化传承发展带来新机遇。
原创文章,作者:Isaiah,如若转载,请注明出处:https://www.qihaozhang.com/archives/7203.html