HKGAI 与 HKChat:香港自主研发的 LLM
香港拥有自己的 LLM。不是包装别人 API 的产品——而是一个真正的模型,从 DeepSeek 专门为香港微调,驱动着一个任何香港市民都可以使用的公共聊天机器人。
这个项目叫做 HKGAI。聊天机器人叫做 HKChat。它的诞生过程说明了香港 AI 的发展方向。
什么是 HKGAI?
香港生成式人工智能研发中心(HKGAI)成立于 2023 年 10 月,是唯一一个专门致力于生成式 AI 的 InnoHK 中心。由科大领导,并与五所合作大学协作:港大、中大、城大、理大和新加坡国立大学。
该中心有八个工作包,涵盖基础模型研发、评估和行业特定应用。但标志性产出是 HKGAI V1——对 DeepSeek 的全参数微调,针对香港情境进行了优化。
为什么要为香港微调 DeepSeek?
通用模型对香港的处理能力很差。它们混淆繁体中文和简体中文。它们不理解粤语口语。它们缺乏关于本地机构、法律、地理和文化的背景知识。
HKGAI V1 通过使用香港特定的数据进行训练来解决这个问题:本地政府文件、法律文本、教育材料和文化内容。结果是一个理解「MTR」意思的模型,知道湾仔和湾仔北的区别,并能以通用模型无法做到的方式回应香港特定的问题。
HKChat——公共聊天机器人
HKChat 是基于 HKGAI V1 构建的面向消费者的产品。它是一个为香港市民设计的免费聊天机器人——类似 ChatGPT,但针对本地需求进行了微调,而且不需要 VPN 就能使用。
该聊天机器人处理一般问题、提供政府服务信息,并理解香港居民生活中的双语环境。
背后的 2 亿美元
HKGAI 由黄廷方慈善基金及信和集团捐赠的 2 亿美元资助。这是私人慈善资金,不是政府拨款——这赋予了项目不寻常的独立性和速度。
这笔捐款是香港历史上对 AI 研究最大的单笔投资之一。它表明私营部门认为香港 AI 值得押注,不仅仅是政府在推动。
应用生态系统
除了 HKChat 之外,HKGAI 还构建了一系列专业应用:
LexiHK — 面向香港法律体系的法律 AI。理解本地法规、案例法和中英文法律术语。鉴于香港是亚洲最大的法律市场之一,这具有真正的商业潜力。
HKPilot — 针对香港英文和中文写作惯例调校的写作助手。
HKMeeting — 会议转录,能处理大多数香港商务会议中英文和粤语之间的语码转换。
HKEcoLink — 针对香港特定生态环境的环境监测和分析。
Hum2Song — 音乐生成。为什么不呢。
为什么这很重要
HKGAI 代表了一件重要的事:一座城市认真对待 AI 主权。与其完全依赖封锁你的美国公司,或可能不会专门为香港优化的中国公司,香港正在建立自己的 AI 能力。
这个模型建立在开源基础上(DeepSeek),由本地大学开发,由本地慈善机构资助,为本地需求而设计。它是香港 AI 抱负最具体的表达——不是路线图或政策文件,而是一个可运行的模型和一个公共聊天机器人。
资料来源
- -HKChat Attracts 90,000 Users — SCMP
- -HKUST Leads HKGAI Development — China Daily
- -Hong Kong Generative AI Research and Development Centre — HKGAI
- -Ng Teng Fong Charitable Foundation Donates for AI — HK Gov
有兴趣了解香港如何建立自己的 AI 基础设施?订阅 Hong Kong AI Podcast,聆听参与其中的研究人员和建设者的对话。
在我们发布新文章和节目时收到通知。没有垃圾邮件,只有信号。