AI 每日資訊摘要 — 2026-05-06

從 210 筆原始抓取去重 + cap → 48 則。10 source 全部 ok(無失敗)。跨日去重命中 65 條(state 累積至 374 條 URL)。

TL;DR

  • 影像/影片:7 則 — wuyoscar/gpt_image_2_skill(GPT Image 2 prompt gallery 包成 Claude Code skill / CLI,1,437 stars)、AI-ModelScope/Realistic_Vision_V5.1_noVAE 鏡像(text-to-image,downloads=4,489)、用戶上架 Ci-QWEN-V1 LoRA(基於 Qwen Image);HF paper 1 篇 Motion-Aware Caching(autoregressive video gen 加速);36kr_ai 2 篇豆包付費商業化評論。
  • AI agent/工具:12 則 — forrestchang/andrej-karpathy-skills(Karpathy 對 LLM coding pitfalls 整理成單一 CLAUDE.md,trending 今日 +2,409 stars)、Amazon 內部全員推 Claude Code 與 Codex、Claudette 開源 Claude Code 桌面伴侶;HF paper 5 篇 agent 相關(T²PO multi-turn RL / Meta CWM 預備度報告 / Marginal Token Allocators 經濟層設計 / OGPP 粒子 flow matching / SymptomAI Fitbit 部署)。
  • 大模型發布:12 則 — OpenAI GPT-5.5 Instant 跨 3 source 同步覆蓋(HN→openai.com 原文 / TechCrunch / 36kr_ai);SubQ 公布 12M-token sub-quadratic LLM;rdmsr 把 Llama2 inference 壓在 1,356 bytes x86 組合語言;mksglu/context-mode 宣稱 98% context 縮減;HF paper 6 篇含 4 篇 benchmark(AcademiClaw / WindowsWorld / Counting / PDACVI)+ 2 篇生醫工具(BlenderRAG / Haiku)。
  • 業界新聞:12 則 — Meta 版權訴訟(Variety + AP 報導指 Zuckerberg「親自授權」)、PayPal 裁員 20% 並推 AI 轉型(HN + TechCrunch 各一則)、ElevenLabs 新投資人 BlackRock/Jamie Foxx/Eva Longoria + ARR $500M、CopilotKit Series A $27M、印度 Krutrim 從 GenAI 模型轉雲端、ASML CEO 強調 EUV 壟斷、Character.AI 因聊天機器人聲稱有醫師執照被告。

影像/影片生成工具(7 則)

wuyoscar/gpt_image_2_skill

Source:GitHub Search | 發布:2026-05-05 | Stars:1,437

wuyoscar 釋出 gpt_image_2_skill,把 OpenAI GPT Image 2 的 prompt gallery、image prompt library 與 CLI 包成 Claude Code skill / Codex skill,topics 含 agent-skills / claude-code-skill / gpt-image-2

Richard Dawkins and the Claude Delusion

Source:Hacker News | 發布:2026-05-05 | HN 32 pts / 45 comments

Matthew Sheffield 在 Flux 部落格發表評論文,以 Dawkins《The God Delusion》模式評論 Claude;經 HN 「Claude」關鍵字觸發進入抓取。

AI-ModelScope/Realistic_Vision_V5.1_noVAE

Source:ModelScope(魔搭)| 發布:2026-05-06(model 創建 2023-11-16)| likes=4 / downloads=4,489

AI-ModelScope 帳號上架 Realistic_Vision V5.1 noVAE 鏡像,task 為 text-to-image-synthesis,原模型為國際開源 Stable Diffusion 系寫實風格 checkpoint。

Motion-Aware Caching for Efficient Autoregressive Video Generation

Source:HuggingFace Papers | 發布:2026-05-03 | paper 2605.01725,1 upvote

Jing Xu 等 10 人提出 motion-aware fine-grained cache 方法,把現有 chunk-level skip 細化到 pixel-level,針對 autoregressive video 生成的高動態區域分配更多 denoising step。

艺术写真美学Ci-QWEN-V1

Source:ModelScope(魔搭)| 發布:2026-05-06(model 創建 2026-05-04)| likes=1 / downloads=22

用戶 overcloud81 上架 Ci-QWEN-V1,task 為 text-to-image-synthesis,定位「艺术写真美学」風格 LoRA(基於阿里 Qwen Image)。

豆包为什么选择了 “最low”的变现方式?

Source:36 氪 AI | 發布:2026-05-05 | 作者 超聚焦

36 氪「超聚焦」評論文,分析字節跳動豆包採用付費訂閱+廣告變現策略的選擇邏輯。

由豆包付费想到,AI到底会长成一门什么生意

Source:36 氪 AI | 發布:2026-05-06 | 作者 吴怼怼

36 氪「吴怼怼」評論文,從豆包付費上線討論國內 AI 商業模式的長期形態。

AI agent/開發工具(12 則)

forrestchang/andrej-karpathy-skills

Source:GitHub Trending | stars_today:2,409

forrestchang 釋出 andrej-karpathy-skills,內容為單一 CLAUDE.md 檔,整理自 Andrej Karpathy 對 LLM coding pitfalls 的觀察,定位「改進 Claude Code 行為」。

Haervwe/open-webui-tools

Source:GitHub Search | 發布:2026-05-05 | Stars:698

Haervwe 釋出 open-webui-tools,模組化工具集含 15+ 工具、function pipelines 與 filters,topics 含 comfyui / letta / arxiv / image-generation / llm-tools

Lessons for Agentic Coding: What should we do when code is cheap?

Source:Hacker News | 發布:2026-05-05 | HN 229 pts / 224 comments

Drew Breunig 部落格貼文,列出 10 條 agentic coding 工程實踐,主題為「程式碼變便宜後該怎麼做」。

Xbox CEO ends Copilot AI development and overhauls leadership

Source:Hacker News | 發布:2026-05-05 | HN 55 pts / 11 comments

Dexerto 報導 Xbox CEO 結束 Xbox 內部 Copilot AI 計畫並重組管理層。

Amazon rolls out Claude Code and Codex internally

Source:Hacker News | 發布:2026-05-05 | HN 18 pts / 10 comments

Business Insider 報導 Amazon 在內部員工反彈後,向全體員工開放 Claude Code 與 OpenAI Codex 使用權。

Show HN: Open-source CLI to generate UI tests from user flows

Source:Hacker News | 發布:2026-05-05 | HN 10 pts / 3 comments

riyajoshi 在 Show HN 釋出 Kusho 開源 CLI(kusho-ai-ui-testing-tui),從使用者流程自動生成 UI 測試。

Claudette – An open-source desktop companion for Claude Code

Source:Hacker News | 發布:2026-05-05 | HN 8 pts / 7 comments

doomspork 在 utensils.io 釋出 Claudette,定位為 Claude Code 的開源桌面伴侶 app。

T²PO: Uncertainty-Guided Exploration Control for Stable Multi-Turn Agentic Reinforcement Learning

Source:HuggingFace Papers | 發布:2026-05-04 | paper 2605.02178,4 upvotes

Haixin Wang 等 10 人提出 T²PO,針對 multi-turn agentic RL 訓練不穩定問題,引入 uncertainty-guided exploration control,補強現有 fine-grained credit assignment 與 trajectory filtering。

Code World Model Preparedness Report

Source:HuggingFace Papers | 發布:2026-05-01 | paper 2605.00932,2 upvotes

Daniel Song 等 24 人發布 Meta CWM(Code World Model)的 frontier preparedness 評估報告,結論為不增加額外 frontier AI 風險,將以 open-weight 釋出。

Agentic AI Systems Should Be Designed as Marginal Token Allocators

Source:HuggingFace Papers | 發布:2026-05-02 | paper 2605.01214,2 upvotes

Siqi Zhu 提出 position paper,主張將 agentic AI 系統設計為 marginal token allocation 經濟體(router / agent / serving stack / scheduling 四個經濟層),而非 token 計價的文字生成器。

Generative Modeling with Orbit-Space Particle Flow Matching

Source:HuggingFace Papers | 發布:2026-05-04 | paper 2605.02222,2 upvotes

Sinan Wang 等 6 人提出 OGPP,為粒子系統的 flow-matching 生成框架,利用 permutation-symmetric orbit-space 處理 anonymous indexing 帶來的高 variance 問題。

SymptomAI: Towards a Conversational AI Agent for Everyday Symptom Assessment

Source:HuggingFace Papers | 發布:2026-05-05 | paper 2605.04012,2 upvotes

Joseph Breda 等 33 人在 Fitbit app 部署 SymptomAI,針對日常症狀回報情境的 conversational AI agent 進行端對端問診與差別診斷評估。

大模型發布(12 則)

mksglu/context-mode

Source:GitHub Trending | stars_today:276

mksglu 釋出 context-mode,定位 AI coding agent 的 context window 優化,sandbox tool output 宣稱達 98% 縮減,支援 14 個平台。

GPT‑5.5 Instant

Source:Hacker News | 發布:2026-05-05 | HN 75 pts / 17 comments

OpenAI 官方頁面公布 GPT-5.5 Instant,定位為 ChatGPT 新版預設模型。

SubQ: a sub-quadratic LLM with 12M-token context

Source:Hacker News | 發布:2026-05-05 | HN 43 pts / 16 comments

SubQ 公司在官網介紹 sub-quadratic LLM,宣稱支援 12M-token context window。

A complete Llama2 inference engine that fits in 1356 bytes of x86 assembly

Source:Hacker News | 發布:2026-05-05 | HN 26 pts / 0 comments

rdmsr 在 GitHub 釋出 sectorllm,把完整 Llama2 inference engine 壓在 1,356 bytes 的 x86 組合語言。

AcademiClaw: When Students Set Challenges for AI Agents

Source:HuggingFace Papers | 發布:2026-05-04 | paper 2605.02661,8 upvotes

Junjie Yu 等 78 人推出 AcademiClaw,雙語 benchmark 含 80 個來自大學生實際學業流程(作業/研究/競賽)的 long-horizon 任務,從 230 個學生候選題挑出當前 AI agent 解不了的題。

WindowsWorld: A Process-Centric Benchmark of Autonomous GUI Agents in Professional Cross-Application Environments

Source:HuggingFace Papers | 發布:2026-04-30 | paper 2604.27776,3 upvotes

Jinchao Li 等 6 人提出 WindowsWorld,process-centric benchmark,評估 GUI agent 在跨應用 professional workflow 的能力,補足 OSWorld 等單應用 benchmark 不足。

Counting as a minimal probe of language model reliability

Source:HuggingFace Papers | 發布:2026-05-03 | paper 2605.02028,2 upvotes

Tianxiang Dai 等 2 人提出 Stable Counting Capacity 評估法,讓模型計數重複符號直到失敗,去除知識依賴以隔離指令遵循與規則執行能力。

Assessing Pancreatic Ductal Adenocarcinoma Vascular Invasion: the PDACVI Benchmark

Source:HuggingFace Papers | 發布:2026-04-30 | paper 2604.27582,1 upvote

M. Riera-Marín 等 26 人發布 PDACVI benchmark,針對胰腺癌(PDAC)血管侵犯的影像評估,補足現有公開資料集對術前分期的支援不足。

BlenderRAG: High-Fidelity 3D Object Generation via Retrieval-Augmented Code Synthesis

Source:HuggingFace Papers | 發布:2026-05-01 | paper 2605.00632,1 upvote

Massimo Rondelli 等 3 人提出 BlenderRAG,用 retrieval-augmented generation 從 500 個 expert-validated 範例(text/code/image)跨 50 物件類別生成 Blender Python 程式碼,宣稱可降低編譯失敗率。

Linking spatial biology and clinical histology via Haiku

Source:HuggingFace Papers | 發布:2026-04-30 | paper 2605.00925,0 upvote

Yan Cui 等 9 人發布 Haiku,tri-modal contrastive 學習模型,整合 multiplexed immunofluorescence 26.7M patches、3,218 tissue sections、1,606 patients 與配對 H&E 病理切片資料。

OpenAI releases GPT-5.5 Instant, a new default model for ChatGPT

Source:TechCrunch AI | 發布:2026-05-05 | 作者 Ivan Mehta

Ivan Mehta 在 TechCrunch 報導 OpenAI 發布 GPT-5.5 Instant,宣稱在法律/醫療/金融等敏感領域降低 hallucination,同時維持低延遲。

刚刚,GPT-5.5 Instant 发布,奥特曼还邀请马斯克参加 AI 办的派对

Source:36 氪 AI | 發布:2026-05-06 | 作者 爱范儿

36 氪「爱范儿」報導 GPT-5.5 Instant 發布,標題提及 Sam Altman 公開邀請 Elon Musk 參加 OpenAI 派對。

AI 業界新聞(12 則)

Source:Hacker News | 發布:2026-05-05 | HN 257 pts / 231 comments

Variety 報導出版商集體訴訟材料指 Zuckerberg「親自授權並鼓勵」Meta 在 Llama 訓練中使用版權內容,原告含 Scott Turow 等作者。

Source:Hacker News | 發布:2026-05-05 | HN 144 pts / 4 comments

AP News 報導同一訴訟事件,出版商指控 Meta AI 訓練侵權且為 Zuckerberg 親自授權。

Persistent Visual Memory: Sustaining Perception for Deep Generation in LVLMs

Source:HuggingFace Papers | 發布:2026-05-01 | paper 2605.00814,13 upvotes

Siyuan Huang 等 9 人提出 PVM,輕量可學模組對抗 LVLM 的「Visual Signal Dilution」現象(textual history 累積導致 visual attention 隨生成長度衰減)。

Hallucinations Undermine Trust; Metacognition is a Way Forward

Source:HuggingFace Papers | 發布:2026-05-02 | paper 2605.01428,10 upvotes

Gal Yona 等 3 人 position paper,主張 factuality 改善從擴張知識邊界轉向 metacognition(讓模型評估自己的回答是否可信)。

PayPal plans 20% job cuts

Source:Hacker News | 發布:2026-05-05 | HN 9 pts / 0 comments

Bloomberg 報導 PayPal 計劃裁員 20%,新 CEO 推動轉型;HN 由 “Sora” 關鍵字命中入選(content 關於 fintech 裁員,與 Sora 無直接關係)。

Character.ai sued over chatbot that claims to be a real doctor with a license

Source:Hacker News | 發布:2026-05-05 | HN 7 pts / 0 comments

Ars Technica 報導 Character.AI 被告,案由為其聊天機器人聲稱自己是「真實有執照的醫生」。

As workers worry about AI, Nvidia’s Jensen Huang says AI is ‘creating an enormous number of jobs’

Source:TechCrunch AI | 發布:2026-05-05 | 作者 Lucas Ropek

Lucas Ropek 在 TechCrunch 報導 Nvidia CEO 黃仁勳的說法:AI 的「殺工作」效應被誇大,他主張 AI 反而創造大量就業。

India’s first GenAI unicorn shifts to cloud services as AI model ambitions face reality

Source:TechCrunch AI | 發布:2026-05-05 | 作者 Jagmeet Singh

Jagmeet Singh 在 TechCrunch 報導印度首家 GenAI 獨角獸 Krutrim 在裁員與產品停滯後,轉向雲端服務。

CopilotKit raises $27M to help devs deploy app-native AI agents

Source:TechCrunch AI | 發布:2026-05-05 | 作者 Ram Iyer

Ram Iyer 在 TechCrunch 報導 CopilotKit 完成 Series A $27M 募資,由 Glilot Capital、NFX、SignalFire 領投,定位協助開發者部署 app-native AI agent。

ElevenLabs lists BlackRock, Jamie Foxx, and Eva Longoria as new investors

Source:TechCrunch AI | 發布:2026-05-05 | 作者 Ivan Mehta

Ivan Mehta 在 TechCrunch 報導 ElevenLabs 公布 BlackRock、Jamie Foxx、Eva Longoria 為新投資人,達 ARR $500M,擴張企業客戶。

PayPal says it’s ‘becoming a technology company again’ — that means AI

Source:TechCrunch AI | 發布:2026-05-05 | 作者 Sarah Perez

Sarah Perez 在 TechCrunch 報導 PayPal 以 AI 為主軸推動轉型,目標 $1.5B 成本節省,配合裁員與技術棧現代化。

ASML CEO Christophe Fouquet on his company’s monopoly: no one is coming for us

Source:TechCrunch AI | 發布:2026-05-05 | 作者 Connie Loizos

Connie Loizos 在 TechCrunch 訪問 ASML CEO Fouquet(2024 年上任),其言論主張公司在 EUV 光刻機市場無對手。

其他(misc,5 則)

未能歸入 4 類但今日 HN 高分或關鍵字命中


跨筆分析

跨筆觀察、與愛格工作的事實連結。不含主觀斷言詞(不寫「適合 / 值得 / score」),只做事實組合。

對愛格/影像影片生成工作直接相關的 5 則

  1. wuyoscar/gpt_image_2_skill(GitHub Search,1,437 stars) — 把 GPT Image 2 prompt gallery + image prompt library + CLI 包成 Claude Code skill / Codex skill;與 Gemini Gem 圖片生成系統 為「圖片生成 prompt 工程封裝」的兩種抽象(前者 Claude Code skill 包裝 GPT Image 2,後者 Gemini Gem persona 由 Claude in Chrome sub-agent 操作)。
  2. 艺术写真美学Ci-QWEN-V1(ModelScope,likes=1 / downloads=22) — 用戶上傳的 text-to-image LoRA,base 為阿里 Qwen Image;與 Qwen Image Edit 2511 工作流 共用 Qwen Image 模型基底(前者為單一風格 LoRA,後者為編輯工作流)。
  3. AI-ModelScope/Realistic_Vision_V5.1_noVAE(ModelScope,downloads=4,489) — text-to-image-synthesis 寫實風格 SD 系 checkpoint 鏡像;與 Gemini Gem 圖片生成系統 在「實景化室內設計圖」場景上為同類功能(一個是 SD 系開源 checkpoint,一個是 Gemini Gem 雲端 API)。
  4. Haervwe/open-webui-tools(GitHub Search,698 stars) — Open-WebUI 模組化擴充工具集,topics 含 comfyui;與 SCAIL骨骼驅動跳舞工作流 與 Z-Image-Turbo 工作流 同 ComfyUI 生態(前者為 Open-WebUI 整合層,後二者為 ComfyUI 內的具體工作流)。
  5. Motion-Aware Caching for Efficient Autoregressive Video Generation(HuggingFace Papers) — 提出 fine-grained pixel-level cache reuse 加速 autoregressive video gen;與 Kling AI 影片生成工作流 與 Omni Video 3 單圖生片範例庫 為「影片生成成本」議題的上游研究(前者為加速研究,後二者為實際生產工具)。

跨筆觀察的 3 個趨勢

Trend 1:OpenAI GPT-5.5 Instant 同事件跨 3 source 同步覆蓋(3/48)

48 則中 3 則為 GPT-5.5 Instant 發布事件覆蓋:HN 由 meetpateltech 提交 OpenAI 官方頁 openai.com/index/gpt-5-5-instant/(HN 75 pts)、TechCrunch AI 由 Ivan Mehta 報導(強調法律/醫療/金融降低 hallucination)、36kr_ai 由「爱范儿」中文覆蓋(標題提 Sam Altman 邀 Musk 參加派對)。3 source 為英文官方(OpenAI)/ 英文媒體(TechCrunch)/ 中文媒體(36kr)三條獨立報導路徑同日命中。

Trend 2:agent_dev bucket 中 Claude Code 周邊占 3/12

agent_dev 12 則中 3 則明確涉及 Claude Code 生態:forrestchang/andrej-karpathy-skills(trending 今日 +2,409 stars,CLAUDE.md 行為調校)、Amazon rolls out Claude Code and Codex internally(企業內部部署)、Claudette(Claude Code 桌面伴侶 app)。三條對應「prompt 規範資產 / 企業導入 / 桌面客戶端」三個不同包裝層次,與 腳本角色系統 的 character-based prompt 累積路徑同屬「以 prompt/skill 為核心資產」的工作模式。

Trend 3:model_release bucket 12 則中 4 則為 benchmark/生醫應用論文

12 則 model_release 中,4 則為 benchmark 或生醫應用論文(AcademiClaw 大學生 long-horizon 任務 / WindowsWorld GUI agent cross-application / Counting 模型計數可靠性 / PDACVI 胰腺癌血管侵犯影像);其餘 8 則含 GPT-5.5 Instant(HN + TC + 36kr 各一則)、SubQ 12M-token sub-quadratic LLM、sectorllm Llama2 1356 bytes 組合語言實作、context-mode、BlenderRAG、Haiku。比例顯示今日該 bucket 主要由 HuggingFace Papers ingest 主導(6/12 來自 HF),benchmark 與生醫工具的 paper 量在「大模型發布」bucket 中比實際模型 ship 訊號更多。

中國方面觀察

業界訊號

中國模型/工具

  • modelscope 入選 2 則均為 image_video bucket:AI-ModelScope/Realistic_Vision_V5.1_noVAE(國際開源 SD 系寫實 checkpoint 鏡像,downloads=4,489)+ overcloud81/Ci-QWEN-V1(用戶上傳的 Qwen Image LoRA,likes=1 / downloads=22)。
  • 今日 modelscope 入選 cap 後僅 2 則(cap 前 9 則),中國原生大型模型發布訊號偏弱。

1 個值得深入研究的方向

wuyoscar/gpt_image_2_skill(GitHub Search,1,437 stars,Python) — 把 GPT Image 2 的 prompt gallery、image prompt library 與 CLI 包成 Claude Code skill / Codex skill,topics 含 agent-skills / claude-code-skill / codex-skill / gpt-image-2-prompts。封裝形態與愛格現有的 Gemini Gem 圖片生成系統 為對照組:前者把 prompt gallery 包成 Claude Code skill(資產主導,由 CLI 觸發),後者把風格 persona 包成 Gemini Gem 並由 Claude in Chrome sub-agent 操作(互動主導,由瀏覽器自動化觸發)。可作為比較兩種「圖片 prompt 工程封裝」抽象的參考。

結構性提醒

  • HF Papers 主導 model_release bucket:12 則 model_release 中 6 則來自 HF Papers,且 4 則為 benchmark/生醫應用論文,並非新模型 ship。cap_dropped_by_bucket: model_release=8 代表還有 8 條被 cap 丟掉。閱讀本日 model_release bucket 應將其視為「模型 + benchmark + 應用 paper」混合 ingest,而非純粹模型發布快照。
  • misc bucket cap drop 71 條:今日有 71 條被歸入 misc 後被 cap 丟掉,僅 5 條入選;其中 1 條(iOS 27 ‘Create a Pass’ Apple Wallet)為「agent」關鍵字 false positive,內容與 AI agent 無關。
  • 跨日去重 state 累積至 374 條 URL:本次 duplicate_url_across_days=65,state 持續成長中,跨日比較性將在後續幾天逐步顯現。

蒐集統計

Source抓到入選(cap 前)失敗原因
Hacker News6059
TechCrunch AI2014
HuggingFace Papers3023
Anthropic91
OpenAI130
GitHub Trending114
GitHub Search(topic 過濾)253
量子位11
36 氪 AI1716
ModelScope(魔搭)249
合計210130(過濾後 cap 前)/ 48(cap 後最終入選)

注意:「入選」欄位為 per_source_kept(過濾去重 / too_old / too_short 後但 cap 前);cap 後的最終分類見 per_bucket(image_video 7 / agent_dev 12 / model_release 12 / industry 12 / misc 5 = 48)。OpenAI 抓到 13 則但 0 進入最終 bucket(全部跨日去重或 cap);ModelScope 9 則中 cap 後僅 2 則進入 image_video,其餘 7 則被 cap 丟掉。

cap 後 per_source 分布(cap-after,從 _classified.jsonl 計算):hackernews 17 / huggingface_papers 14 / techcrunch_ai 7 / 36kr_ai 3 / github_search 3 / github_trending 2 / modelscope 2 / qbitai 0(cap drop) / anthropic 0(cap drop) / openai 0。

跳過原因

  • 跨日重複(duplicate_url_across_days):65 則
  • 同次重複(duplicate_url_in_run):1 則
  • 超出 7 天 window(too_old):14 則
  • 內容太薄 < 30 字(too_short):0 則
  • 缺 URL(missing_url):0 則
  • 缺標題(missing_title):0 則
  • 主 bucket 已滿(cap drop):image_video 0 / agent_dev 1 / model_release 8 / industry 2 / misc 71

事實檢查 diff log

第 4.6 步 5 項自檢的當日執行紀錄。陷阱類型定義參見 AI每日分析事實檢查陷阱。

自檢項check 數發現問題修復
1. 存在性 grep(每個 repo/paper 名)300
2. 計數驗證(N/M 聲明)41regex 用 ASCII - 抓不到 HN title 的 unicode 連字號 U+2011(GPT‑5.5);補手動掃 HN openai.com/index/gpt-5-5-instant/ URL 後確認 GPT-5.5 跨 3 source(HN+TC+36kr)成立。Trend 2 (3/12)、Trend 3 (4/12 benchmark)、China sources cap-after 5 條皆 Python regex 驗證通過
3. cap 前/後 標註30蒐集統計表已標明「過濾後 cap 前 130 / cap 後 48」;per_source_kept (cap 前) 與 per_bucket (cap 後) 區分明確,並補列 cap-after per_source 分布
4. 列舉去重10Top 5 image/video URL list 經 set() 比對無重複
5. wikilink 語意對應80Gemini Gem / Qwen Image Edit / SCAIL / Z-Image-Turbo / Kling AI / Omni Video 3 / 腳本角色系統 / AI每日分析事實檢查陷阱 — 8 條 wikilink 全部存在於 wiki/concepts/ 下

新踩陷阱(concept 頁未涵蓋)

自檢 2 發現的 unicode 連字號 regex 漏接(GPT‑5.5 U+2011 vs GPT-5.5 U+002D)屬「正則匹配 unicode 變體字元」類別,對應 AI每日分析事實檢查陷阱 既有「陷阱 3:列舉條目不在 jsonl」的延伸(用 ASCII regex 漏掉 unicode 變體導致少算)。可在後續報告統一改用 [\-‐-―] 字元類別匹配各種連字號,或對 title 先 NFKC normalize。本日不開新陷阱條目,併入既有陷阱 3 的擴充註記。

累積改善計數

  • ai-news pipeline 啟用日:2026-05-04
  • 第 4.6 步事實自檢啟用日:2026-05-04
  • 已記錄陷阱類型總數:7(AI每日分析事實檢查陷阱)