4.7开源AI动态：小LLM与本地部署

迷你教学LLM：9M参数揭秘Transformer原理

开发者arman-bd推出开源项目GuppyLM，一款约900万参数的极简LLM，旨在帮助开发者直观理解语言模型底层逻辑。该模型基于标准Transformer架构，使用6万条合成对话数据训练，仅用130行PyTorch代码实现，在免费Colab T4实例上仅需5分钟即可完成训练。
项目自带趣味设定——默认角色“鱼”将生命意义定义为食物，开发者可通过fork项目快速替换角色设定，适合AI入门学习者上手实践。

Gemma生态更新：本地部署与实时交互落地

两款基于Google Gemma模型的开源项目今日亮相，推动大模型本地化与实时交互场景落地。其一，开发者分享了使用LM Studio全新无头CLI工具结合Claude Code，在本地运行Gemma 4的技术方案，为无图形界面环境下的大模型部署提供了便捷路径。
其二，开源项目Parlor实现了在M3 Pro芯片上的实时AI交互功能，支持音视频输入与语音输出，依托Gemma E2B模型，让低功耗设备也能运行流畅的多模态AI交互应用。

TPU优化代码模型：低成本高效Nanocode

开源项目Nanocode今日发布讨论，该模型采用纯JAX框架开发，针对TPU进行优化，号称仅需200美元成本即可获得媲美Claude Code的代码能力。模型聚焦高效代码生成与处理场景，适合开发者在TPU环境下低成本搭建专业代码辅助工具，为AI代码开发生态提供了轻量化选择。

参考来源

Show HN: I built a tiny LLM to demystify how language models work：https://github.com/arman-bd/guppylm
Running Gemma 4 locally with LM Studio's new headless CLI and Claude Code：https://ai.georgeliu.com/p/running-google-gemma-4-locally-with
Show HN: Real-time AI (audio/video in, voice out) on an M3 Pro with Gemma E2B：https://github.com/fikrikarim/parlor
Nanocode: The best Claude Code that $200 can buy in pure JAX on TPUs：https://github.com/salmanmohammadi/nanocode/discussions/1