AI 每日資訊摘要 — 2026-05-05

從 183 筆原始抓取去重 + cap → 52 則。10 source 全部 ok（無失敗）。

TL;DR

影像／影片：12 則 — InvokeAI（27K stars）、Comfy-Org/desktop（ComfyUI 桌面版）、Anil-matcha/Open-Generative-AI（200+ 模型自架平台）今日 GitHub 活躍；HuggingFace Papers 4 篇 diffusion 相關（Prox-E 3D 編輯、多物體生成、Decision Trees ↔ Diffusion 統一、ComboStoc）；ModelScope 上架 Tencent-Hunyuan HY-World-2.0、flux-krea LoRA、ColorFlow、Qwen-image-2512-桃源風格 4 個圖像鏡像。
AI agent／工具：12 則 — ChromeDevTools/chrome-devtools-mcp（38K stars，Chrome DevTools as MCP server）、msitarzewski/agency-agents（多角色 agent 平台）、virattt/dexter（金融研究 agent）入榜；HN 出現 Show HN: Agent-evals（Claude skill）、SprintiQ（Claude Code sprint 規劃工具）、XGrammar-2（80x faster 結構化生成 for tool calling）。
大模型發布：12 則 — 全 12 則來自 ModelScope，其中 10 則為 IBM Granite code 系列鏡像（3b / 8b / 20b / 34b 多 variant）、1 則 Meta Llama-3.2V-11B-cot 鏡像、1 則 nomic-embed-text-v1 鏡像。
業界新聞：11 則 — 大型資本動作集中：Sierra $950M @ $15B、Anthropic $1.5B Wall Street JV、OpenAI $10B PE JV、Cerebras IPO（估值 $26.6B）、JuliaHub $65M；Oracle 大規模裁員報導；中國法院判 AI 不能作為單一裁員理由；Elon Musk 對 OpenAI 的訴訟新訊息。

影像／影片生成工具（12 則）

invoke-ai/InvokeAI

Source：GitHub Search ｜發布：2026-05-05

InvokeAI（27,111 stars）— Stable Diffusion 系創意引擎，提供 WebUI 並作為多個商業產品基礎，topics 含 inpainting / outpainting / latent-diffusion。

Anil-matcha/Open-Generative-AI

Source：GitHub Search ｜發布：2026-05-04

Open-Generative-AI（11,344 stars，MIT 授權）— 自架式無內容過濾的 AI 圖像／影片生成平台，整合 200+ 模型（Flux / Midjourney / Kling / Sora / Veo），定位為 Higgsfield AI / Freepik AI / Krea AI / Openart 的替代。

Comfy-Org/desktop

Source：GitHub Search ｜發布：2026-05-04

Comfy-Org/desktop（2,197 stars）— ComfyUI 官方桌面版 Windows / macOS app，TypeScript 寫成。

混元世界模型 2.0 HY-World-2.0

Source：ModelScope（魔搭）｜發布：2026-05-05（model 創建 2026-04-16）

Tencent-Hunyuan 在 ModelScope 上架混元世界模型 2.0，task 為 image-to-3D，likes=58、downloads=25,443。

Prox-E: Fine-Grained 3D Shape Editing via Primitive-Based Abstractions

Source：HuggingFace Papers ｜發布：2026-04-29

Etai Sella 等 6 人提出 Prox-E，training-free 框架，把 2D image editing 模型用於精細 3D 編輯，著重「保留物件整體 identity 同時允許局部結構變更」，13 upvotes。

When Do Diffusion Models learn to Generate Multiple Objects?

Source：HuggingFace Papers ｜發布：2026-04-30

Yujin Jeong 等 5 人分析 text-to-image diffusion 在多物體生成上的失敗成因，從資料分布角度分兩個 regime（concept generalization / 不同 dataset 大小）討論，5 upvotes。

Trees to Flows and Back: Unifying Decision Trees and Diffusion Models

Source：HuggingFace Papers ｜發布：2026-05-01

Sai Niranjan Ramachandran 等 2 人提出 Global Trajectory Score Matching（GTSM），建立決策樹與 diffusion 過程之間的數學對應，論述 gradient boosting 在理想化版本下漸近最優，5 upvotes。

ComboStoc: Combinatorial Stochasticity for Diffusion Generative Models

Source：HuggingFace Papers ｜發布：2026-04-29

Rui Xu 等 9 人探討 diffusion 模型的組合複雜度（combinatorial complexity），指出現行訓練 scheme 對「維度 × 屬性」組合空間覆蓋不足，2 upvotes。

flux-krea-extracted-lora

Source：ModelScope（魔搭）｜發布：2026-05-05

AI-ModelScope 帳號上架 flux-krea-extracted-lora，task 為 image-to-image，likes=2、downloads=169。

ColorFlow

Source：ModelScope（魔搭）｜發布：2026-05-05

AI-ModelScope 帳號上架 ColorFlow，task 為 text-to-image-synthesis，likes=1、downloads=1,256。

Qwen-image-2512-桃源風格

Source：ModelScope（魔搭）｜發布：2026-05-05

用戶 shutaoyuan 上架 Qwen-image-2512-桃源風格，task 為 text-to-image-synthesis，likes=1、downloads=20。

豆包將在免費模式外新增付費訂閱，推出三檔月包/年包價格

Source：36 氪 AI ｜發布：2026-05-04

36 氪報導豆包將在免費模式外推三檔付費訂閱，目前細節仍在測試階段，正式上線時官方渠道發布完整訊息。

AI agent／開發工具（12 則）

ChromeDevTools/chrome-devtools-mcp

Source：GitHub Search ｜發布：2026-05-04

ChromeDevTools org 推出 chrome-devtools-mcp（38,095 stars），把 Chrome DevTools 包成 MCP server 供 coding agents 呼叫，topics 含 mcp-server / puppeteer / browser。

msitarzewski/agency-agents

Source：GitHub Trending ｜ stars_today：1,189

msitarzewski 釋出 agency-agents，定位「完整的 AI agency」— 包含前端、Reddit 社群、whimsy injectors、reality checkers 等多角色專家 agent，每個 agent 有人格與既定流程。

virattt/dexter

Source：GitHub Trending ｜ stars_today：409

virattt 釋出 dexter，autonomous agent for deep financial research（深度金融研究自主代理）。

Agent Skills

Source：Hacker News ｜發布：2026-05-04 ｜ HN 132 pts / 42 comments

Addy Osmani（Google Chrome DevRel）發布部落格文章 Agent Skills。

Web2BigTable: A Bi-Level Multi-Agent LLM System for Internet-Scale Information Search and Extraction

Source：HuggingFace Papers ｜發布：2026-04-29

Yuxuan Huang 等 9 人提出 Web2BigTable，bi-level multi-agent 框架，同時支援深度單目標推理與跨多 entity 的結構化彙整，27 upvotes。

Load balancing usage across Codex accounts

Source：Hacker News ｜發布：2026-05-04 ｜ HN 8 pts / 2 comments

pepsipu 部落格文章，討論 Codex agent 工作負載在多帳號之間的排程與分配。

Show HN: Agent-evals – Claude skill to build your own evals

Source：Hacker News ｜發布：2026-05-04 ｜ HN 6 pts / 1 comments

fsilavong 釋出 agent-eval — Claude skill 形式的 eval 建構工具。

XGrammar-2: 80x Faster Structured Generation for Agent Tool Calling

Source：Hacker News ｜發布：2026-05-04 ｜ HN 6 pts / 0 comments

ubospica（MLC AI）發布 XGrammar-2，宣稱對 agent tool calling 的結構化生成達 80x 加速。

Ask HN: When did you move from AI agentic loops to simpler deterministic system?

Source：Hacker News ｜發布：2026-05-04 ｜ HN 6 pts / 2 comments

laxmena 在 HN 發起討論：何時／為何從 AI agentic loop 切換回簡單的 deterministic 系統。

SprintiQ – open-source sprint planning for Claude Code

Source：Hacker News ｜發布：2026-05-04 ｜ HN 6 pts / 1 comments

SprintiQ-Incorporated 釋出 sprintiq — 為 Claude Code 設計的 open-source sprint 規劃工具。

Learning to Act and Cooperate for Distributed Black-Box Consensus Optimization

Source：HuggingFace Papers ｜發布：2026-05-01

Zi-Bo Qin 等 4 人探討 distributed black-box consensus 在 multi-agent 系統的最佳化，著重 local 適應 / global 協調 / 通訊效率三者平衡，2 upvotes。

PhysicianBench: Evaluating LLM Agents in Real-World EHR Environments

Source：HuggingFace Papers ｜發布：2026-05-04

Ruoqi Liu 等 13 人發布 PhysicianBench，基於電子病歷（EHR）環境評估 LLM agent 在臨床醫師任務上的長 horizon 複合工作流，包含 100 個長 horizon 任務，1 upvote。

大模型發布（12 則）

nomic-embed-text-v1

Source：ModelScope（魔搭）｜發布：2026-05-05

AI-ModelScope 鏡像 nomic-embed-text-v1，task 為 sentence-similarity，likes=7、downloads=8,805。

granite-3b-code-base

Source：ModelScope（魔搭）｜發布：2026-05-05

AI-ModelScope 鏡像 IBM granite-3b-code-base，text-generation，downloads=2,848。

granite-8b-code-base-4k-GGUF

Source：ModelScope（魔搭）｜發布：2026-05-05

AI-ModelScope 鏡像 IBM granite-8b-code-base 的 4k-context GGUF 量化版，downloads=1,134。

granite-3b-code-instruct

Source：ModelScope（魔搭）｜發布：2026-05-05

AI-ModelScope 鏡像 IBM granite-3b-code-instruct，downloads=2,835。

granite-8b-code-instruct-128k

Source：ModelScope（魔搭）｜發布：2026-05-05

AI-ModelScope 鏡像 IBM granite-8b-code-instruct 的 128k context 版，downloads=1,156。

granite-8b-code-instruct-4k-GGUF

Source：ModelScope（魔搭）｜發布：2026-05-05

AI-ModelScope 鏡像 IBM granite-8b-code-instruct 的 4k GGUF 量化版，downloads=1,135。

granite-3b-code-base-2k

Source：ModelScope（魔搭）｜發布：2026-05-05

AI-ModelScope 鏡像 IBM granite-3b-code-base 的 2k context 變體，downloads=1,160。

granite-3b-code-instruct-128k

Source：ModelScope（魔搭）｜發布：2026-05-05

AI-ModelScope 鏡像 IBM granite-3b-code-instruct 的 128k context 版，downloads=1,167。

granite-34b-code-instruct-8k

Source：ModelScope（魔搭）｜發布：2026-05-05

AI-ModelScope 鏡像 IBM granite-34b-code-instruct 的 8k context 版（系列中規模最大），downloads=1,155。

granite-3b-code-instruct-2k

Source：ModelScope（魔搭）｜發布：2026-05-05

AI-ModelScope 鏡像 IBM granite-3b-code-instruct 的 2k context 版，downloads=1,170。

Llama-3.2V-11B-cot

Source：ModelScope（魔搭）｜發布：2026-05-05

AI-ModelScope 鏡像 Llama-3.2V-11B-cot（多模態 image-text-to-text，cot 變體），downloads=1,608。

granite-20b-code-base

Source：ModelScope（魔搭）｜發布：2026-05-05

AI-ModelScope 鏡像 IBM granite-20b-code-base，downloads=2,804。

AI 業界新聞（11 則）

Sierra Raises $950M at $15B Valuation

Source：Hacker News ｜發布：2026-05-04 ｜ HN 94 pts / 119 comments

Sierra 官方 blog 公告完成 $950M 募資、估值 $15B。

AI startup JuliaHub raises $65M to rival Simulink

Source：Hacker News ｜發布：2026-05-04 ｜ HN 24 pts / 3 comments

Axios 報導 JuliaHub 完成 $65M 募資，定位為 Simulink 的競品（前 Snowflake CEO Bob Muglia 領銜）。

OpenAI Finalizes $10B Joint Venture with PE Firms to Deploy AI

Source：Hacker News ｜發布：2026-05-04 ｜ HN 17 pts / 2 comments

Bloomberg 報導 OpenAI 與 PE firms 完成 $10B 合資以部署 AI 基礎設施。

CATL says sodium batteries are mainstream-ready, signs 60 GWh deal

Source：Hacker News ｜發布：2026-05-04 ｜ HN 15 pts / 6 comments

Electrek 報導 CATL 簽下 60 GWh 鈉離子電池儲能合約，宣告鈉電池商用就緒。

‘Everyone’s a Line on a Spreadsheet:’ Inside Oracle’s Mass Layoffs

Source：Hacker News ｜發布：2026-05-04 ｜ HN 9 pts / 1 comments

TIME 報導 Oracle 大規模裁員內幕，副標連結 AI 浪潮對科技就業的影響。

Can anyone point me to a ShowHN first post policy documentation?

Source：Hacker News ｜發布：2026-05-04 ｜ HN 9 pts / 9 comments

upwindchange 在 HN 詢問 Show HN 首次發文政策文件位置。

Anthropic Unveils $1.5B Joint Venture with Wall Street Firms

Source：Hacker News ｜發布：2026-05-04 ｜ HN 6 pts / 1 comments

WSJ 報導 Anthropic 與 Wall Street 公司宣布 $1.5B 合資。

Chinese court rules companies can’t fire workers just because AI is cheaper

Source：Hacker News ｜發布：2026-05-04 ｜ HN 6 pts / 0 comments

Tom’s Hardware 報導中國法院判決：自動化（AI 替代）本身不足以構成解僱員工的合法理由。

Elon Musk sent ominous texts to Greg Brockman, Sam Altman after asking for a settlement, OpenAI claims

Source：TechCrunch AI ｜發布：2026-05-04

TechCrunch 報導 OpenAI 提交的訴訟材料：Musk 在請求和解後傳訊息給 Brockman 與 Altman，稱若 OpenAI 不和解他們將「成為美國最被痛恨的人」。

Sierra raises $950M as the race to own enterprise AI gets serious

Source：TechCrunch AI ｜發布：2026-05-04

TechCrunch 角度報導 Sierra $950M 募資（總可用資金超過 $1B），目標成為「企業 AI 客戶體驗的全球標準」。

OpenAI’s cozy partner Cerebras is on track for a blockbuster IPO

Source：TechCrunch AI ｜發布：2026-05-04

TechCrunch 報導 AI 晶片公司 Cerebras 朝向估值 $26.6B+ IPO 邁進，與 OpenAI 的合作關係深厚。

其他（misc，5 則）

未能歸入 4 類但今日 HN 高分或關鍵字命中

Talking to strangers at the gym — Hacker News（HN 1193 pts）— Sora 關鍵字命中（內容非 AI 相關）
Incident with Issues and Webhooks – Resolved — Hacker News（HN 421 pts）— GitHub 故障已修復
gyunggyung/AGI-Papers — GitHub Search（391 stars）— Agents / Architecture / Training / RAG / On-Device AI 整理 repo
Days without GitHub incidents — Hacker News（HN 358 pts）— GitHub 故障日數計時網站
How OpenAI delivers low-latency voice AI at scale — Hacker News（HN 304 pts）— OpenAI 官方介紹語音 AI 低延遲架構

跨筆分析

跨筆觀察、與愛格工作的事實連結。不含主觀斷言詞（不寫「適合 / 值得 / score」），只做事實組合。

對愛格／影像影片生成工作直接相關的 5 則

Anil-matcha/Open-Generative-AI（GitHub Search，11,344 stars） — 自架平台整合 Flux / Midjourney / Kling / Sora / Veo 200+ 模型，README 把 Higgsfield AI 列為被替代對象；與既有 Higgsfield MCP 圖片影片生成工具為同一生態（替代品 vs 受替代品的關係）。
混元世界模型 2.0 HY-World-2.0（ModelScope） — Tencent-Hunyuan 上架 image-to-3D 模型（25,443 downloads）；與建築AI動畫可靈篇教學筆記同屬「2D → 3D / 空間動畫」的上游生成路徑。
flux-krea-extracted-lora（ModelScope） — image-to-image LoRA，FLUX 家族延伸；與 FLUX2 Klein 多圖編輯工作流同 FLUX 家族（前者為單一 LoRA，後者為多圖編輯流程）。
Comfy-Org/desktop（GitHub Search，2,197 stars） — ComfyUI 官方桌面版（Win/macOS）；既有 SCAIL骨骼驅動跳舞工作流與 Z-Image-Turbo 工作流皆以 ComfyUI 為執行環境，桌面版與目前 web 版功能對應。
Qwen-image-2512-桃源風格（ModelScope） — 用戶上傳的 Qwen-image style LoRA；與 Qwen Image Edit 2511 工作流為同一 Qwen Image 模型基底。

跨筆觀察的 3 個趨勢

Trend 1：今日 model_release bucket 100% 為 ModelScope 鏡像，內容以 IBM Granite code 系列為主（10/12）

12 則 model_release 全部來自 modelscope source，沒有任何 OpenAI / Anthropic / HuggingFace 原生 model_release 進入該 bucket。其中 10/12 是 IBM Granite code 系列（granite-3b / 8b / 20b / 34b / -base / -instruct / -128k / -2k / -4k-GGUF 多 variant），1/12 是 Meta Llama-3.2V-11B-cot 鏡像，1/12 是 nomic-embed-text-v1 鏡像。cap_dropped_by_bucket: model_release=6，代表還有 6 則被 cap 丟掉（同樣以鏡像為主的 ModelScope 條目）。今日 bucket 不反映「全球大模型發布」的全貌，僅反映 ModelScope mirror 帳號活動。

Trend 2：industry bucket 大型資本動作集中（5 起獨立融資/IPO 事件占 6/11 則）

industry 11 則中含資本動作關鍵字（融資/估值/IPO/JV）的有 6 則，對應 5 起獨立事件：Sierra $950M @ $15B（HN + TechCrunch 各報一則）、Anthropic $1.5B Wall Street JV、OpenAI $10B PE JV、Cerebras IPO（估值 $26.6B+）、JuliaHub $65M。其中 Sierra、OpenAI、Anthropic、Cerebras 4 起均涉及 enterprise AI 部署或 AI 基礎設施。

Trend 3：agent_dev 中 Claude Code / MCP 生態相關項目占 3/12

12 則 agent_dev 中明確提到 Claude / MCP 的有 3 則：chrome-devtools-mcp（38,095 stars，把 Chrome DevTools 包成 MCP server）、Agent-evals（自我描述為 Claude skill）、SprintiQ（為 Claude Code 設計的 sprint 規劃工具）。這 3 則對應「MCP server / Claude skill / Claude Code 周邊」三種不同包裝方式，與社群監控系統的 Claude in Chrome 路徑為同類抽象。

中國方面觀察

業界訊號

中國法院判決：自動化（AI 替代）本身不足以構成解僱員工的合法理由（Tom’s Hardware 報導 / HN）。
36 氪報導豆包將在免費模式外推三檔付費訂閱，細節仍在測試。

中國模型／工具

Tencent-Hunyuan 上架 HY-World-2.0（image-to-3D，downloads=25,443），為今日唯一中國原生大型多模態模型發布。
ModelScope 平台 AI-ModelScope 帳號當日有 16 則被 dedupe_classify 保留入 cap 後分類，內容多為非中國原生模型的鏡像（IBM Granite、Meta Llama、nomic-embed），原生 / 中國自製內容包括 ColorFlow、flux-krea-extracted-lora、Qwen-image-2512-桃源風格。
用戶 shutaoyuan 上架 Qwen-image-2512-桃源風格 LoRA（基於阿里 Qwen Image 模型）。

1 個值得深入研究的方向

ChromeDevTools/chrome-devtools-mcp（38,095 stars） — 由 ChromeDevTools 官方 GitHub org 發布，把 Chrome DevTools API 包成 MCP server 給 coding agent 呼叫，topics 含 mcp-server / puppeteer / chrome-devtools。今日社群監控系統與愛格的 IG / FB 監控、可靈／Gemini 影片生成皆用 Claude in Chrome 路徑（瀏覽器自動化），chrome-devtools-mcp 提供 MCP 規範的 DevTools 操作層為可參照的另一種包裝方式（MCP server vs Chrome Extension agent 兩種抽象的同類選項）。

結構性提醒

model_release bucket 嚴重偏 ModelScope：今日 12/12 為 modelscope source，且 10 則為 IBM Granite 系列鏡像（單一 IBM 模型家族的多 variant）。閱讀本日報告 model_release bucket 時須意識到這不等於全球大模型發布，僅為單一 mirror 帳號活動的快照。
HuggingFace Papers cap drop 高：fetched=30，過濾後 kept=14，最終入選 7（4 image_video + 3 agent_dev）。其餘被 bucket cap 丟掉，代表 paper 端有更多條目未進入今日報告。
跨日去重 state 已 244 條 URL：本次 duplicate_url_across_days=49，state 在持續累積中，比較性將在後續幾天逐步顯現。

蒐集統計

Source	抓到	入選	失敗原因
Hacker News	56	55	–
TechCrunch AI	10	8	–
HuggingFace Papers	30	14	–
Anthropic	9	1	–
OpenAI	13	0	–
GitHub Trending	10	4	–
GitHub Search（topic 過濾）	25	5	–
量子位	1	1	–
36 氪 AI	7	3	–
ModelScope（魔搭）	22	22	–
合計	183	113（過濾後 cap 前）／ 52（cap 後最終入選）	–

注意：「入選」欄位為 per_source_kept（過濾去重 / too_old / too_short 後但 cap 前）；cap 後的最終分類見 per_bucket（image_video 12 / agent_dev 12 / model_release 12 / industry 11 / misc 5 = 52）。OpenAI 抓到 13 則但 0 進入最終 bucket，代表 OpenAI 內容多被 cap 或關鍵字未命中；Anthropic 抓到 9、過濾後 1，亦多被 cap 丟掉（見下表）。

跳過原因

跨日重複（duplicate_url_across_days）：49 則
同次重複（duplicate_url_in_run）：0 則
超出 7 天 window（too_old）：19 則
內容太薄 < 30 字（too_short）：2 則
缺 URL（missing_url）：0 則
缺標題（missing_title）：0 則
主 bucket 已滿（cap drop）：image_video 0 / agent_dev 0 / model_release 6 / industry 0 / misc 55

事實檢查 diff log

第 4.6 步 5 項自檢的當日執行紀錄。陷阱類型定義參見 AI每日分析事實檢查陷阱。

自檢項	check 數	修復
1. 存在性 grep（每個 repo/paper 名）	21	–
2. 計數驗證（N/M 聲明）	3	Granite 10/12、Funding 6/11、Claude/MCP 3/12 三項聲明皆 Python regex 驗證通過
3. cap 前/後標註	5	蒐集統計表已標明「過濾後 cap 前 113 / cap 後 52」；per_source_kept 與 per_bucket 區分明確
4. 列舉去重	1	Top 5 image/video 列表 5 個 URL 經 set() 比對無重複
5. wikilink 語意對應	6	Higgsfield MCP / 建築AI動畫可靈篇 / FLUX2 Klein / SCAIL / Z-Image-Turbo / Qwen Image Edit / 社群監控系統 / AI每日分析事實檢查陷阱皆已存在於 wiki/concepts/ 下

新踩陷阱（concept 頁未涵蓋）

本日無新類型陷阱。

累積改善計數

ai-news pipeline 啟用日：2026-05-04
第 4.6 步事實自檢啟用日：2026-05-04
已記錄陷阱類型總數：7（AI每日分析事實檢查陷阱）

探索

AI 每日資訊摘要 — 2026-05-05

AI 每日資訊摘要 — 2026-05-05

TL;DR

影像／影片生成工具（12 則）

AI agent／開發工具（12 則）

大模型發布（12 則）

AI 業界新聞（11 則）

其他（misc，5 則）

跨筆分析

對愛格／影像影片生成工作直接相關的 5 則

跨筆觀察的 3 個趨勢

Trend 1：今日 model_release bucket 100% 為 ModelScope 鏡像，內容以 IBM Granite code 系列為主（10/12）

Trend 2：industry bucket 大型資本動作集中（5 起獨立融資/IPO 事件占 6/11 則）

Trend 3：agent_dev 中 Claude Code / MCP 生態相關項目占 3/12

中國方面觀察

業界訊號

中國模型／工具

1 個值得深入研究的方向

結構性提醒

蒐集統計

跳過原因

事實檢查 diff log

新踩陷阱（concept 頁未涵蓋）

累積改善計數

關係圖譜

目錄

反向連結