AI 每日資訊摘要 — 2026-05-06
從 210 筆原始抓取去重 + cap → 48 則。10 source 全部 ok(無失敗)。跨日去重命中 65 條(state 累積至 374 條 URL)。
TL;DR
- 影像/影片:7 則 — wuyoscar/gpt_image_2_skill(GPT Image 2 prompt gallery 包成 Claude Code skill / CLI,1,437 stars)、AI-ModelScope/Realistic_Vision_V5.1_noVAE 鏡像(text-to-image,downloads=4,489)、用戶上架 Ci-QWEN-V1 LoRA(基於 Qwen Image);HF paper 1 篇 Motion-Aware Caching(autoregressive video gen 加速);36kr_ai 2 篇豆包付費商業化評論。
- AI agent/工具:12 則 — forrestchang/andrej-karpathy-skills(Karpathy 對 LLM coding pitfalls 整理成單一 CLAUDE.md,trending 今日 +2,409 stars)、Amazon 內部全員推 Claude Code 與 Codex、Claudette 開源 Claude Code 桌面伴侶;HF paper 5 篇 agent 相關(T²PO multi-turn RL / Meta CWM 預備度報告 / Marginal Token Allocators 經濟層設計 / OGPP 粒子 flow matching / SymptomAI Fitbit 部署)。
- 大模型發布:12 則 — OpenAI GPT-5.5 Instant 跨 3 source 同步覆蓋(HN→openai.com 原文 / TechCrunch / 36kr_ai);SubQ 公布 12M-token sub-quadratic LLM;rdmsr 把 Llama2 inference 壓在 1,356 bytes x86 組合語言;mksglu/context-mode 宣稱 98% context 縮減;HF paper 6 篇含 4 篇 benchmark(AcademiClaw / WindowsWorld / Counting / PDACVI)+ 2 篇生醫工具(BlenderRAG / Haiku)。
- 業界新聞:12 則 — Meta 版權訴訟(Variety + AP 報導指 Zuckerberg「親自授權」)、PayPal 裁員 20% 並推 AI 轉型(HN + TechCrunch 各一則)、ElevenLabs 新投資人 BlackRock/Jamie Foxx/Eva Longoria + ARR $500M、CopilotKit Series A $27M、印度 Krutrim 從 GenAI 模型轉雲端、ASML CEO 強調 EUV 壟斷、Character.AI 因聊天機器人聲稱有醫師執照被告。
影像/影片生成工具(7 則)
wuyoscar/gpt_image_2_skill
Source:GitHub Search | 發布:2026-05-05 | Stars:1,437
wuyoscar 釋出 gpt_image_2_skill,把 OpenAI GPT Image 2 的 prompt gallery、image prompt library 與 CLI 包成 Claude Code skill / Codex skill,topics 含
agent-skills/claude-code-skill/gpt-image-2。
Richard Dawkins and the Claude Delusion
Source:Hacker News | 發布:2026-05-05 | HN 32 pts / 45 comments
Matthew Sheffield 在 Flux 部落格發表評論文,以 Dawkins《The God Delusion》模式評論 Claude;經 HN 「Claude」關鍵字觸發進入抓取。
AI-ModelScope/Realistic_Vision_V5.1_noVAE
Source:ModelScope(魔搭)| 發布:2026-05-06(model 創建 2023-11-16)| likes=4 / downloads=4,489
AI-ModelScope 帳號上架 Realistic_Vision V5.1 noVAE 鏡像,task 為 text-to-image-synthesis,原模型為國際開源 Stable Diffusion 系寫實風格 checkpoint。
Motion-Aware Caching for Efficient Autoregressive Video Generation
Source:HuggingFace Papers | 發布:2026-05-03 | paper 2605.01725,1 upvote
Jing Xu 等 10 人提出 motion-aware fine-grained cache 方法,把現有 chunk-level skip 細化到 pixel-level,針對 autoregressive video 生成的高動態區域分配更多 denoising step。
艺术写真美学Ci-QWEN-V1
Source:ModelScope(魔搭)| 發布:2026-05-06(model 創建 2026-05-04)| likes=1 / downloads=22
用戶 overcloud81 上架 Ci-QWEN-V1,task 為 text-to-image-synthesis,定位「艺术写真美学」風格 LoRA(基於阿里 Qwen Image)。
豆包为什么选择了 “最low”的变现方式?
Source:36 氪 AI | 發布:2026-05-05 | 作者 超聚焦
36 氪「超聚焦」評論文,分析字節跳動豆包採用付費訂閱+廣告變現策略的選擇邏輯。
由豆包付费想到,AI到底会长成一门什么生意
Source:36 氪 AI | 發布:2026-05-06 | 作者 吴怼怼
36 氪「吴怼怼」評論文,從豆包付費上線討論國內 AI 商業模式的長期形態。
AI agent/開發工具(12 則)
forrestchang/andrej-karpathy-skills
Source:GitHub Trending | stars_today:2,409
forrestchang 釋出 andrej-karpathy-skills,內容為單一 CLAUDE.md 檔,整理自 Andrej Karpathy 對 LLM coding pitfalls 的觀察,定位「改進 Claude Code 行為」。
Haervwe/open-webui-tools
Source:GitHub Search | 發布:2026-05-05 | Stars:698
Haervwe 釋出 open-webui-tools,模組化工具集含 15+ 工具、function pipelines 與 filters,topics 含
comfyui/letta/arxiv/image-generation/llm-tools。
Lessons for Agentic Coding: What should we do when code is cheap?
Source:Hacker News | 發布:2026-05-05 | HN 229 pts / 224 comments
Drew Breunig 部落格貼文,列出 10 條 agentic coding 工程實踐,主題為「程式碼變便宜後該怎麼做」。
Xbox CEO ends Copilot AI development and overhauls leadership
Source:Hacker News | 發布:2026-05-05 | HN 55 pts / 11 comments
Dexerto 報導 Xbox CEO 結束 Xbox 內部 Copilot AI 計畫並重組管理層。
Amazon rolls out Claude Code and Codex internally
Source:Hacker News | 發布:2026-05-05 | HN 18 pts / 10 comments
Business Insider 報導 Amazon 在內部員工反彈後,向全體員工開放 Claude Code 與 OpenAI Codex 使用權。
Show HN: Open-source CLI to generate UI tests from user flows
Source:Hacker News | 發布:2026-05-05 | HN 10 pts / 3 comments
riyajoshi 在 Show HN 釋出 Kusho 開源 CLI(kusho-ai-ui-testing-tui),從使用者流程自動生成 UI 測試。
Claudette – An open-source desktop companion for Claude Code
Source:Hacker News | 發布:2026-05-05 | HN 8 pts / 7 comments
doomspork 在 utensils.io 釋出 Claudette,定位為 Claude Code 的開源桌面伴侶 app。
T²PO: Uncertainty-Guided Exploration Control for Stable Multi-Turn Agentic Reinforcement Learning
Source:HuggingFace Papers | 發布:2026-05-04 | paper 2605.02178,4 upvotes
Haixin Wang 等 10 人提出 T²PO,針對 multi-turn agentic RL 訓練不穩定問題,引入 uncertainty-guided exploration control,補強現有 fine-grained credit assignment 與 trajectory filtering。
Code World Model Preparedness Report
Source:HuggingFace Papers | 發布:2026-05-01 | paper 2605.00932,2 upvotes
Daniel Song 等 24 人發布 Meta CWM(Code World Model)的 frontier preparedness 評估報告,結論為不增加額外 frontier AI 風險,將以 open-weight 釋出。
Agentic AI Systems Should Be Designed as Marginal Token Allocators
Source:HuggingFace Papers | 發布:2026-05-02 | paper 2605.01214,2 upvotes
Siqi Zhu 提出 position paper,主張將 agentic AI 系統設計為 marginal token allocation 經濟體(router / agent / serving stack / scheduling 四個經濟層),而非 token 計價的文字生成器。
Generative Modeling with Orbit-Space Particle Flow Matching
Source:HuggingFace Papers | 發布:2026-05-04 | paper 2605.02222,2 upvotes
Sinan Wang 等 6 人提出 OGPP,為粒子系統的 flow-matching 生成框架,利用 permutation-symmetric orbit-space 處理 anonymous indexing 帶來的高 variance 問題。
SymptomAI: Towards a Conversational AI Agent for Everyday Symptom Assessment
Source:HuggingFace Papers | 發布:2026-05-05 | paper 2605.04012,2 upvotes
Joseph Breda 等 33 人在 Fitbit app 部署 SymptomAI,針對日常症狀回報情境的 conversational AI agent 進行端對端問診與差別診斷評估。
大模型發布(12 則)
mksglu/context-mode
Source:GitHub Trending | stars_today:276
mksglu 釋出 context-mode,定位 AI coding agent 的 context window 優化,sandbox tool output 宣稱達 98% 縮減,支援 14 個平台。
GPT‑5.5 Instant
Source:Hacker News | 發布:2026-05-05 | HN 75 pts / 17 comments
OpenAI 官方頁面公布 GPT-5.5 Instant,定位為 ChatGPT 新版預設模型。
SubQ: a sub-quadratic LLM with 12M-token context
Source:Hacker News | 發布:2026-05-05 | HN 43 pts / 16 comments
SubQ 公司在官網介紹 sub-quadratic LLM,宣稱支援 12M-token context window。
A complete Llama2 inference engine that fits in 1356 bytes of x86 assembly
Source:Hacker News | 發布:2026-05-05 | HN 26 pts / 0 comments
rdmsr 在 GitHub 釋出 sectorllm,把完整 Llama2 inference engine 壓在 1,356 bytes 的 x86 組合語言。
AcademiClaw: When Students Set Challenges for AI Agents
Source:HuggingFace Papers | 發布:2026-05-04 | paper 2605.02661,8 upvotes
Junjie Yu 等 78 人推出 AcademiClaw,雙語 benchmark 含 80 個來自大學生實際學業流程(作業/研究/競賽)的 long-horizon 任務,從 230 個學生候選題挑出當前 AI agent 解不了的題。
WindowsWorld: A Process-Centric Benchmark of Autonomous GUI Agents in Professional Cross-Application Environments
Source:HuggingFace Papers | 發布:2026-04-30 | paper 2604.27776,3 upvotes
Jinchao Li 等 6 人提出 WindowsWorld,process-centric benchmark,評估 GUI agent 在跨應用 professional workflow 的能力,補足 OSWorld 等單應用 benchmark 不足。
Counting as a minimal probe of language model reliability
Source:HuggingFace Papers | 發布:2026-05-03 | paper 2605.02028,2 upvotes
Tianxiang Dai 等 2 人提出 Stable Counting Capacity 評估法,讓模型計數重複符號直到失敗,去除知識依賴以隔離指令遵循與規則執行能力。
Assessing Pancreatic Ductal Adenocarcinoma Vascular Invasion: the PDACVI Benchmark
Source:HuggingFace Papers | 發布:2026-04-30 | paper 2604.27582,1 upvote
M. Riera-Marín 等 26 人發布 PDACVI benchmark,針對胰腺癌(PDAC)血管侵犯的影像評估,補足現有公開資料集對術前分期的支援不足。
BlenderRAG: High-Fidelity 3D Object Generation via Retrieval-Augmented Code Synthesis
Source:HuggingFace Papers | 發布:2026-05-01 | paper 2605.00632,1 upvote
Massimo Rondelli 等 3 人提出 BlenderRAG,用 retrieval-augmented generation 從 500 個 expert-validated 範例(text/code/image)跨 50 物件類別生成 Blender Python 程式碼,宣稱可降低編譯失敗率。
Linking spatial biology and clinical histology via Haiku
Source:HuggingFace Papers | 發布:2026-04-30 | paper 2605.00925,0 upvote
Yan Cui 等 9 人發布 Haiku,tri-modal contrastive 學習模型,整合 multiplexed immunofluorescence 26.7M patches、3,218 tissue sections、1,606 patients 與配對 H&E 病理切片資料。
OpenAI releases GPT-5.5 Instant, a new default model for ChatGPT
Source:TechCrunch AI | 發布:2026-05-05 | 作者 Ivan Mehta
Ivan Mehta 在 TechCrunch 報導 OpenAI 發布 GPT-5.5 Instant,宣稱在法律/醫療/金融等敏感領域降低 hallucination,同時維持低延遲。
刚刚,GPT-5.5 Instant 发布,奥特曼还邀请马斯克参加 AI 办的派对
Source:36 氪 AI | 發布:2026-05-06 | 作者 爱范儿
36 氪「爱范儿」報導 GPT-5.5 Instant 發布,標題提及 Sam Altman 公開邀請 Elon Musk 參加 OpenAI 派對。
AI 業界新聞(12 則)
Zuckerberg ‘Personally Authorized and Encouraged’ Meta’s Copyright Infringement
Source:Hacker News | 發布:2026-05-05 | HN 257 pts / 231 comments
Variety 報導出版商集體訴訟材料指 Zuckerberg「親自授權並鼓勵」Meta 在 Llama 訓練中使用版權內容,原告含 Scott Turow 等作者。
Zuckerberg ‘personally authorized’ Meta’s copyright infringement, publishers say
Source:Hacker News | 發布:2026-05-05 | HN 144 pts / 4 comments
AP News 報導同一訴訟事件,出版商指控 Meta AI 訓練侵權且為 Zuckerberg 親自授權。
Persistent Visual Memory: Sustaining Perception for Deep Generation in LVLMs
Source:HuggingFace Papers | 發布:2026-05-01 | paper 2605.00814,13 upvotes
Siyuan Huang 等 9 人提出 PVM,輕量可學模組對抗 LVLM 的「Visual Signal Dilution」現象(textual history 累積導致 visual attention 隨生成長度衰減)。
Hallucinations Undermine Trust; Metacognition is a Way Forward
Source:HuggingFace Papers | 發布:2026-05-02 | paper 2605.01428,10 upvotes
Gal Yona 等 3 人 position paper,主張 factuality 改善從擴張知識邊界轉向 metacognition(讓模型評估自己的回答是否可信)。
PayPal plans 20% job cuts
Source:Hacker News | 發布:2026-05-05 | HN 9 pts / 0 comments
Bloomberg 報導 PayPal 計劃裁員 20%,新 CEO 推動轉型;HN 由 “Sora” 關鍵字命中入選(content 關於 fintech 裁員,與 Sora 無直接關係)。
Character.ai sued over chatbot that claims to be a real doctor with a license
Source:Hacker News | 發布:2026-05-05 | HN 7 pts / 0 comments
Ars Technica 報導 Character.AI 被告,案由為其聊天機器人聲稱自己是「真實有執照的醫生」。
As workers worry about AI, Nvidia’s Jensen Huang says AI is ‘creating an enormous number of jobs’
Source:TechCrunch AI | 發布:2026-05-05 | 作者 Lucas Ropek
Lucas Ropek 在 TechCrunch 報導 Nvidia CEO 黃仁勳的說法:AI 的「殺工作」效應被誇大,他主張 AI 反而創造大量就業。
India’s first GenAI unicorn shifts to cloud services as AI model ambitions face reality
Source:TechCrunch AI | 發布:2026-05-05 | 作者 Jagmeet Singh
Jagmeet Singh 在 TechCrunch 報導印度首家 GenAI 獨角獸 Krutrim 在裁員與產品停滯後,轉向雲端服務。
CopilotKit raises $27M to help devs deploy app-native AI agents
Source:TechCrunch AI | 發布:2026-05-05 | 作者 Ram Iyer
Ram Iyer 在 TechCrunch 報導 CopilotKit 完成 Series A $27M 募資,由 Glilot Capital、NFX、SignalFire 領投,定位協助開發者部署 app-native AI agent。
ElevenLabs lists BlackRock, Jamie Foxx, and Eva Longoria as new investors
Source:TechCrunch AI | 發布:2026-05-05 | 作者 Ivan Mehta
Ivan Mehta 在 TechCrunch 報導 ElevenLabs 公布 BlackRock、Jamie Foxx、Eva Longoria 為新投資人,達 ARR $500M,擴張企業客戶。
PayPal says it’s ‘becoming a technology company again’ — that means AI
Source:TechCrunch AI | 發布:2026-05-05 | 作者 Sarah Perez
Sarah Perez 在 TechCrunch 報導 PayPal 以 AI 為主軸推動轉型,目標 $1.5B 成本節省,配合裁員與技術棧現代化。
ASML CEO Christophe Fouquet on his company’s monopoly: no one is coming for us
Source:TechCrunch AI | 發布:2026-05-05 | 作者 Connie Loizos
Connie Loizos 在 TechCrunch 訪問 ASML CEO Fouquet(2024 年上任),其言論主張公司在 EUV 光刻機市場無對手。
其他(misc,5 則)
未能歸入 4 類但今日 HN 高分或關鍵字命中
- ChaofanTao/Autoregressive-Models-in-Vision-Survey — GitHub Search(799 stars)— TMLR 2025 視覺自回歸模型 survey 整理 repo。
- AI didn’t delete your database, you did — Hacker News(HN 491 pts)— idiallo 部落格貼文,主題為 AI coding 的責任歸屬。
- Accelerating Gemma 4: faster inference with multi-token prediction drafters — Hacker News(HN 455 pts)— Google blog 介紹 Gemma 4 的 multi-token prediction drafter 推論加速技術。
- Train Your Own LLM from Scratch — Hacker News(HN 424 pts)— angelos-p 釋出從零訓練 LLM 的教學 repo。
- iOS 27 is adding a ‘Create a Pass’ button to Apple Wallet — Hacker News(HN 382 pts)— alentodorov 部落格貼文(與 AI agent 無關,由 “agent” 關鍵字 false positive 觸發入選)。
跨筆分析
跨筆觀察、與愛格工作的事實連結。不含主觀斷言詞(不寫「適合 / 值得 / score」),只做事實組合。
對愛格/影像影片生成工作直接相關的 5 則
- wuyoscar/gpt_image_2_skill(GitHub Search,1,437 stars) — 把 GPT Image 2 prompt gallery + image prompt library + CLI 包成 Claude Code skill / Codex skill;與 Gemini Gem 圖片生成系統 為「圖片生成 prompt 工程封裝」的兩種抽象(前者 Claude Code skill 包裝 GPT Image 2,後者 Gemini Gem persona 由 Claude in Chrome sub-agent 操作)。
- 艺术写真美学Ci-QWEN-V1(ModelScope,likes=1 / downloads=22) — 用戶上傳的 text-to-image LoRA,base 為阿里 Qwen Image;與 Qwen Image Edit 2511 工作流 共用 Qwen Image 模型基底(前者為單一風格 LoRA,後者為編輯工作流)。
- AI-ModelScope/Realistic_Vision_V5.1_noVAE(ModelScope,downloads=4,489) — text-to-image-synthesis 寫實風格 SD 系 checkpoint 鏡像;與 Gemini Gem 圖片生成系統 在「實景化室內設計圖」場景上為同類功能(一個是 SD 系開源 checkpoint,一個是 Gemini Gem 雲端 API)。
- Haervwe/open-webui-tools(GitHub Search,698 stars) — Open-WebUI 模組化擴充工具集,topics 含
comfyui;與 SCAIL骨骼驅動跳舞工作流 與 Z-Image-Turbo 工作流 同 ComfyUI 生態(前者為 Open-WebUI 整合層,後二者為 ComfyUI 內的具體工作流)。 - Motion-Aware Caching for Efficient Autoregressive Video Generation(HuggingFace Papers) — 提出 fine-grained pixel-level cache reuse 加速 autoregressive video gen;與 Kling AI 影片生成工作流 與 Omni Video 3 單圖生片範例庫 為「影片生成成本」議題的上游研究(前者為加速研究,後二者為實際生產工具)。
跨筆觀察的 3 個趨勢
Trend 1:OpenAI GPT-5.5 Instant 同事件跨 3 source 同步覆蓋(3/48)
48 則中 3 則為 GPT-5.5 Instant 發布事件覆蓋:HN 由 meetpateltech 提交 OpenAI 官方頁 openai.com/index/gpt-5-5-instant/(HN 75 pts)、TechCrunch AI 由 Ivan Mehta 報導(強調法律/醫療/金融降低 hallucination)、36kr_ai 由「爱范儿」中文覆蓋(標題提 Sam Altman 邀 Musk 參加派對)。3 source 為英文官方(OpenAI)/ 英文媒體(TechCrunch)/ 中文媒體(36kr)三條獨立報導路徑同日命中。
Trend 2:agent_dev bucket 中 Claude Code 周邊占 3/12
agent_dev 12 則中 3 則明確涉及 Claude Code 生態:forrestchang/andrej-karpathy-skills(trending 今日 +2,409 stars,CLAUDE.md 行為調校)、Amazon rolls out Claude Code and Codex internally(企業內部部署)、Claudette(Claude Code 桌面伴侶 app)。三條對應「prompt 規範資產 / 企業導入 / 桌面客戶端」三個不同包裝層次,與 腳本角色系統 的 character-based prompt 累積路徑同屬「以 prompt/skill 為核心資產」的工作模式。
Trend 3:model_release bucket 12 則中 4 則為 benchmark/生醫應用論文
12 則 model_release 中,4 則為 benchmark 或生醫應用論文(AcademiClaw 大學生 long-horizon 任務 / WindowsWorld GUI agent cross-application / Counting 模型計數可靠性 / PDACVI 胰腺癌血管侵犯影像);其餘 8 則含 GPT-5.5 Instant(HN + TC + 36kr 各一則)、SubQ 12M-token sub-quadratic LLM、sectorllm Llama2 1356 bytes 組合語言實作、context-mode、BlenderRAG、Haiku。比例顯示今日該 bucket 主要由 HuggingFace Papers ingest 主導(6/12 來自 HF),benchmark 與生醫工具的 paper 量在「大模型發布」bucket 中比實際模型 ship 訊號更多。
中國方面觀察
業界訊號
- 36kr_ai 兩篇豆包付費商業化評論(超聚焦/“最low”的变现方式 + 吴怼怼/AI到底会长成一门什么生意),同議題不同作者連續討論國內 AI 商業模式。
- 36kr_ai 對 OpenAI GPT-5.5 Instant 的中文覆蓋(爱范儿報導),標題切入點為 Altman 邀請 Musk 參加派對,與英文媒體聚焦於「法律/醫療/金融降低 hallucination」的角度不同。
中國模型/工具
- modelscope 入選 2 則均為 image_video bucket:AI-ModelScope/Realistic_Vision_V5.1_noVAE(國際開源 SD 系寫實 checkpoint 鏡像,downloads=4,489)+ overcloud81/Ci-QWEN-V1(用戶上傳的 Qwen Image LoRA,likes=1 / downloads=22)。
- 今日 modelscope 入選 cap 後僅 2 則(cap 前 9 則),中國原生大型模型發布訊號偏弱。
1 個值得深入研究的方向
wuyoscar/gpt_image_2_skill(GitHub Search,1,437 stars,Python) — 把 GPT Image 2 的 prompt gallery、image prompt library 與 CLI 包成 Claude Code skill / Codex skill,topics 含 agent-skills / claude-code-skill / codex-skill / gpt-image-2-prompts。封裝形態與愛格現有的 Gemini Gem 圖片生成系統 為對照組:前者把 prompt gallery 包成 Claude Code skill(資產主導,由 CLI 觸發),後者把風格 persona 包成 Gemini Gem 並由 Claude in Chrome sub-agent 操作(互動主導,由瀏覽器自動化觸發)。可作為比較兩種「圖片 prompt 工程封裝」抽象的參考。
結構性提醒
- HF Papers 主導 model_release bucket:12 則 model_release 中 6 則來自 HF Papers,且 4 則為 benchmark/生醫應用論文,並非新模型 ship。
cap_dropped_by_bucket: model_release=8代表還有 8 條被 cap 丟掉。閱讀本日 model_release bucket 應將其視為「模型 + benchmark + 應用 paper」混合 ingest,而非純粹模型發布快照。 - misc bucket cap drop 71 條:今日有 71 條被歸入 misc 後被 cap 丟掉,僅 5 條入選;其中 1 條(iOS 27 ‘Create a Pass’ Apple Wallet)為「agent」關鍵字 false positive,內容與 AI agent 無關。
- 跨日去重 state 累積至 374 條 URL:本次
duplicate_url_across_days=65,state 持續成長中,跨日比較性將在後續幾天逐步顯現。
蒐集統計
| Source | 抓到 | 入選(cap 前) | 失敗原因 |
|---|---|---|---|
| Hacker News | 60 | 59 | – |
| TechCrunch AI | 20 | 14 | – |
| HuggingFace Papers | 30 | 23 | – |
| Anthropic | 9 | 1 | – |
| OpenAI | 13 | 0 | – |
| GitHub Trending | 11 | 4 | – |
| GitHub Search(topic 過濾) | 25 | 3 | – |
| 量子位 | 1 | 1 | – |
| 36 氪 AI | 17 | 16 | – |
| ModelScope(魔搭) | 24 | 9 | – |
| 合計 | 210 | 130(過濾後 cap 前)/ 48(cap 後最終入選) | – |
注意:「入選」欄位為
per_source_kept(過濾去重 / too_old / too_short 後但 cap 前);cap 後的最終分類見per_bucket(image_video 7 / agent_dev 12 / model_release 12 / industry 12 / misc 5 = 48)。OpenAI 抓到 13 則但 0 進入最終 bucket(全部跨日去重或 cap);ModelScope 9 則中 cap 後僅 2 則進入 image_video,其餘 7 則被 cap 丟掉。
cap 後 per_source 分布(cap-after,從
_classified.jsonl計算):hackernews 17 / huggingface_papers 14 / techcrunch_ai 7 / 36kr_ai 3 / github_search 3 / github_trending 2 / modelscope 2 / qbitai 0(cap drop) / anthropic 0(cap drop) / openai 0。
跳過原因
- 跨日重複(duplicate_url_across_days):65 則
- 同次重複(duplicate_url_in_run):1 則
- 超出 7 天 window(too_old):14 則
- 內容太薄 < 30 字(too_short):0 則
- 缺 URL(missing_url):0 則
- 缺標題(missing_title):0 則
- 主 bucket 已滿(cap drop):image_video 0 / agent_dev 1 / model_release 8 / industry 2 / misc 71
事實檢查 diff log
第 4.6 步 5 項自檢的當日執行紀錄。陷阱類型定義參見 AI每日分析事實檢查陷阱。
| 自檢項 | check 數 | 發現問題 | 修復 |
|---|---|---|---|
| 1. 存在性 grep(每個 repo/paper 名) | 30 | 0 | – |
| 2. 計數驗證(N/M 聲明) | 4 | 1 | regex 用 ASCII - 抓不到 HN title 的 unicode 連字號 U+2011(GPT‑5.5);補手動掃 HN openai.com/index/gpt-5-5-instant/ URL 後確認 GPT-5.5 跨 3 source(HN+TC+36kr)成立。Trend 2 (3/12)、Trend 3 (4/12 benchmark)、China sources cap-after 5 條皆 Python regex 驗證通過 |
| 3. cap 前/後 標註 | 3 | 0 | 蒐集統計表已標明「過濾後 cap 前 130 / cap 後 48」;per_source_kept (cap 前) 與 per_bucket (cap 後) 區分明確,並補列 cap-after per_source 分布 |
| 4. 列舉去重 | 1 | 0 | Top 5 image/video URL list 經 set() 比對無重複 |
| 5. wikilink 語意對應 | 8 | 0 | Gemini Gem / Qwen Image Edit / SCAIL / Z-Image-Turbo / Kling AI / Omni Video 3 / 腳本角色系統 / AI每日分析事實檢查陷阱 — 8 條 wikilink 全部存在於 wiki/concepts/ 下 |
新踩陷阱(concept 頁未涵蓋)
自檢 2 發現的 unicode 連字號 regex 漏接(
GPT‑5.5U+2011 vsGPT-5.5U+002D)屬「正則匹配 unicode 變體字元」類別,對應 AI每日分析事實檢查陷阱 既有「陷阱 3:列舉條目不在 jsonl」的延伸(用 ASCII regex 漏掉 unicode 變體導致少算)。可在後續報告統一改用[\-‐-―]字元類別匹配各種連字號,或對 title 先 NFKC normalize。本日不開新陷阱條目,併入既有陷阱 3 的擴充註記。
累積改善計數
- ai-news pipeline 啟用日:2026-05-04
- 第 4.6 步事實自檢啟用日:2026-05-04
- 已記錄陷阱類型總數:7(AI每日分析事實檢查陷阱)