EP082026年5月11日00:49:25
法律 LLM、预训练与自组 AI 硬件
Jeremy Chow
私募 M&A 律师兼法律 AI 创办人
澳洲籍私募 M&A 律师,现为法律 AI 初创创办人。公司聚焦私募基金文件自动化,并自己搭建推理硬件以避免客户资料上公共云。对模型预训练、开源权重 LLM(Qwen、Kimi、DeepSeek)以及家中自建 AI 基建有深入认识。工作背景横跨悉尼与香港的私募基金法律实务。
Legal TechPre-TrainingOpen-Weight LLMs
章节
- 0:00开场 — AI Tinkerers 重聚、认识 Jeremy
- 1:24Jeremy 自我介绍 — M&A 律师兼硬件狂人
- 2:47从挖 Dogecoin 到 AI 推理硬件
- 3:42法律 AI 初创 — 聚焦私募基金文件
- 5:48在客厅跑 LLM 推理服务器
- 7:00暖风机 vs 显卡 — 香港夏天的散热难题
- 9:05预训练数据天花板 — 光爬网不够
- 11:03LLM 真的适合法律工作吗?
- 13:43一个逗号改变一切 — 法律精确度 vs AI
- 16:22隐性知识与师徒制的问题
- 18:55Unitree 机器人春晚表演 — 即时适应能力
- 20:32热气与中医 — 身体感知作为大数据
- 23:28《银翼杀手》「雨中泪水」— 数据无法捕捉的东西
- 26:15香港主流媒体的 AI 盲点
- 27:04深圳山姆超市里用 Qwen 的阿姨
- 29:28AI Tinkerers — 香港的实践者社群
- 30:28开源权重 vs 开源 — 为什么 Qwen 重要
- 33:54小模型大能力 — 日本车的比喻
- 35:55AI 定价可持续吗?— VC 资金的数学
- 37:25中环码头三号与一封给香港的情书
- 42:52火车、边境与大湾区的未来
- 48:55结尾 — 狗狗、海景、下次见
关于本集
Jeremy 是一位私募 M&A 律师,同时在做一间法律 AI 初创——他还把 LLM 推理伺服器放在家中客厅运行,因为他从 14 岁就开始砌电脑(最初为了玩 Call of Duty),之后挖 Dogecoin,结果发现所有这些知识完美对应到训练和跑模型所需的硬件。我们深入讨论为甚么律师不能用 ChatGPT、Claude 或 Gemini 处理客户资料、为甚么整个私募股权领域几乎没有出现在 LLM 的训练资料里、为甚么 Qwen 的表现远远超过它的体积,以及预训练天花板是真实存在的。