ข้ามไปยังเนื้อหา

OpenAI ขยับครบ stack วันเดียว · Subquadratic เปิด context 12 ล้าน · coding agent ลงมือถือ

วันที่ 6 พฤษภาคมเป็นวันที่ OpenAI ไม่ใช่บริษัทโมเดลอีกต่อไป.

อ่าน 20 นาที
Original work by ii23 (gpt-image-2 bento composition)

OpenAI ขยับครบ stack วันเดียว · Subquadratic เปิด context 12 ล้าน · coding agent ลงมือถือ

วันที่ 6 พฤษภาคมเป็นวันที่ OpenAI ไม่ใช่บริษัทโมเดลอีกต่อไป. เขาเปลี่ยน default ของ ChatGPT เป็น GPT-5.5 Instant, รื้อ WebRTC ใหม่หมดเพื่อ voice AI, เปิด Ads Manager ให้ใครๆ ก็ซื้อโฆษณา ChatGPT ได้, จับมือ PwC ขายบริการ CFO, แล้วยังมีข่าวลือว่าเตรียมผลิต AI phone ในปี 2027. ทั้งหมดนี้เปิดในวันเดียวกัน. ฝั่งโมเดล Subquadratic เปิด SubQ context 12 ล้าน token (12M token) พร้อม prefill เร็วขึ้น 52 เท่าในงาน million-token. ฝั่ง coding agent — TRAE SOLO ลงมือถือ, Augment Cosmos เปิดเป็น agent OS สำหรับทีม. ฝั่ง Google ปล่อย dev tool รัวๆ ทั้ง AI Studio Vibe Coding, Gemini File Search, NotebookLM Mind Maps, Pomelli Catalog. และ Anthropic ก็ส่ง Claude finance agent template ลง production แล้ว.

อ่านยาวเพราะวันนี้มี 20 เรื่อง. แต่จัดเป็น 5 keynote moment ให้เห็นภาพรวม — model layer, context window, coding agent, Google dev stack, Claude enterprise.

OpenAI สวมหมวกครบ stack วันเดียว

วันนี้ OpenAI ปล่อย 5 ข่าวพร้อมกันที่บอกตรงๆ ว่าเขาเปลี่ยนนิยามของบริษัทตัวเองแล้ว — ไม่ใช่บริษัทโมเดลอย่างเดียว แต่กำลังเป็น software + ad network + business services + hardware vendor พร้อมกัน.

GPT-5.5 Instant เป็น default ใหม่ของ ChatGPT (Story #1)

OpenAI GPT-5.5 Instant rollout

OpenAI ประกาศว่า GPT-5.5 Instant กลายเป็น default model ใหม่ของ ChatGPT ทุก user แทนที่ GPT-5.3 Instant พร้อมเรียกผ่าน API ในชื่อ gpt-5.5-chat-latest.

OpenAI โฆษณาว่าโมเดลใหม่ “อัปเกรดใหญ่” — ฉลาดขึ้นในงานทั่วไป, วิเคราะห์รูปดีขึ้น, และ hallucinate (คิดเรื่องไม่จริง) น้อยลงอย่างชัดเจน. สไตล์การเขียนถูก rewrite ใหม่ให้สั้นกระชับ ไม่ฟุ่มเฟือย — ใครที่บ่นว่า ChatGPT พูดเยอะเกินไป จะรู้สึกถึงความเปลี่ยนแปลงทันทีหลัง rollout.

อีกด้านหนึ่งที่สำคัญพอๆ กันคือ memory — ChatGPT ตอนนี้จำเรื่องเก่าได้แม่นขึ้น และเพิ่มฟีเจอร์ memory sources ที่เปิดให้ user ดูได้เลยว่าคำตอบ personalize มาจาก context ส่วนไหน, แล้ว manage ลบ/แก้ได้ตรงจุด.

มีจุดที่ต้องระวัง — token price คูณสอง (Story #16)

OpenRouter GPT-5.5 cost analysis

แต่ก่อนจะดีใจ — OpenRouter เผยแพร่งานวิเคราะห์ที่ระบุว่า user ที่ migrate จาก GPT-5.4 มา GPT-5.5 จ่ายแพงขึ้น 49% ถึง 92%. เหตุผลคือ token price คูณสองเต็มตัว, และถึงแม้ output จะสั้นลง 19% ถึง 34% ใน prompt ยาวๆ ก็ไม่พอชดเชย.

ถ้าคุณรัน workflow ที่ใช้ GPT-5.x หนัก แนะนำให้คำนวณ cost ใหม่ก่อน auto-upgrade ไปใช้ default ใหม่.

OpenAI รื้อ WebRTC ใหม่ทั้งระบบ (Story #15)

OpenAI WebRTC architecture

ฝั่ง infra OpenAI เขียน blog เล่าว่ารื้อ WebRTC stack ใหม่ทั้งระบบ เพื่อให้ voice AI ตอบทันความเร็วพูดธรรมชาติ. แทนที่จะใช้ media server หนักๆ แบบเดิม, ทีม OpenAI เลือก architecture ใหม่: thin relay (relay บางๆ ที่ไม่ทำ media processing เอง) คู่กับ stateful transceiver (ตัวรับส่งที่จำ session state ไว้ที่ edge).

ที่ใช้คือ ChatGPT voice และ Realtime API — ครอบคลุมทั่วโลก, low-latency จริง. นี่คือ infra หลังบ้านของ voice agent OpenAI ที่ developer ส่วนใหญ่ไม่เคยเห็น.

ChatGPT Ads เปิด self-serve + CPC (Story #17)

ChatGPT Ads Manager

OpenAI ประกาศขยายโฆษณา ChatGPT แบบจริงจัง — เปิด Ads Manager แบบ self-serve สำหรับ advertiser ในอเมริกา (เริ่มเป็น beta), เพิ่มโหมดประมูลแบบ CPC (cost per click) มาคู่กับ CPM (cost per mille) เดิม.

นอกจากนี้ยังเปิด Conversions API กับ pixel measurement เพื่อให้ advertiser track conversion ได้ — แต่ออกแบบให้ aggregate-only ไม่อ่านบทสนทนาของ user. นั่นแปลว่า OpenAI กำลังเตรียมตัวเป็น ad platform จริงจังแบบเดียวกับ Google และ Meta — ChatGPT ที่มีคนใช้ทุกวันเยอะมหาศาลกลายเป็น ad inventory ใหม่ของอุตสาหกรรม.

OpenAI × PwC — agent ในงาน CFO (Story #18)

OpenAI PwC collaboration

OpenAI จับมือ PwC ช่วยทีม CFO ใช้ AI Agent ทำ workflow การเงิน — planning, forecast, reporting, procurement, payment, treasury, tax และปิดบัญชี (month-end close). ทำเป็น production จริง ไม่ใช่ pilot.

ที่น่าสนใจคือ OpenAI พิสูจน์ในบ้านตัวเองก่อน: ใช้ Codex ทำให้ contract processing เร็วขึ้น 5 เท่า. และตอนนี้ทั้งคู่กำลังเอา experience นั้นไปเป็น playbook ให้บริษัทใหญ่ deploy ตามได้.

ลือหนัก — OpenAI AI phone ปี 2027 (Story #20)

OpenAI AI phone rumor

นักวิเคราะห์ Ming-Chi Kuo (郭明錤) เปิดเผยว่า OpenAI วางเป้า mass production AI phone เครื่องแรกครึ่งปีแรก 2027. ตัวเครื่องคาดว่าใช้ MediaTek Dimensity 9600 custom เป็น chip เดียว — supplier เจ้าเดียว.

ถ้าเป็นจริง, OpenAI จะคุม model + software (ChatGPT) + ad platform + enterprise services + hardware ครบ stack ใน 2 ปีข้างหน้า. นี่เป็น playbook ของ Apple แต่กลับมาด้วย AI เป็น core.

สรุป moment นี้: OpenAI กำลังย้ายจาก research lab ที่ขายโมเดลให้ developer มาเป็น full-stack platform company. ใครที่ build บน OpenAI API ทุกวัน — เริ่มคิดเรื่อง vendor lock-in ได้แล้ว.

Context window 12 ล้าน token เริ่มเป็นของจริง

ขยับมาที่ฝั่งโมเดล. วันนี้มี 4 ข่าวที่บอกว่า “ของถูก ของเร็ว ของยาว” ใกล้เป็นมาตรฐานใหม่.

Subquadratic เปิด SubQ — context 12M token (Story #3)

SubQ 12M context

Subquadratic ประกาศ early access สำหรับ SubQ — โมเดลที่สร้างบน architecture ใหม่ชื่อ Subquadratic Sparse Attention (SSA). จุดขายคือ:

Specค่า
Context window12 ล้าน token
Prefill speedup (1M token task)สูงสุด 52 เท่า
AccessAPI + coding agent

12 ล้าน token แปลว่าอะไร — แปลว่า codebase ทั้งบริษัทระดับ enterprise ใส่เข้า context รอบเดียว, เอกสาร compliance ทั้ง folder อ่านพร้อมกัน, หรือ research paper หลายร้อยฉบับวิเคราะห์ครั้งเดียวได้. ที่ผ่านมาโมเดลที่อวดว่า support 1M context ส่วนใหญ่ใช้จริงไม่ไหวเพราะ prefill ช้าจนรอไม่ได้. SSA แก้ตรงนี้ — 52× faster prefill หมายความว่า workflow จริงเริ่มเข้าใกล้ใช้งานได้.

ตอนนี้เปิด early access สองทาง: API ตรงๆ และ coding agent ที่ Subquadratic ทำเอง. ใครทำงานกับ codebase ใหญ่ๆ ลองสมัครได้.

Gemma 4 + MTP drafter — เร็วขึ้น 3 เท่า (Story #2)

Gemma 4 MTP drafter

Google DeepMind เปิด open-source MTP drafter (Multi-Token Prediction drafter) สำหรับ Gemma 4 ทุกขนาด. เป็น draft model ที่ใช้ speculative decoding — ทำนาย token ขนานหลายตัวต่อรอบ แล้วให้ main model verify, โดย share KV cache กับ main model.

ผลลัพธ์: inference เร็วขึ้นสูงสุด 3 เท่า โดยไม่ลด output quality. นี่คือ open contribution ที่ทุก dev ที่ใช้ Gemma 4 บน edge หรือ self-host จะได้ประโยชน์ทันทีโดยไม่ต้อง retrain.

Inworld Realtime TTS-2 — voice ที่ฟังบทสนทนาได้ (Story #4)

Inworld AI ปล่อย Realtime TTS-2 ที่ไม่ใช่ TTS ธรรมดา — โมเดลฟัง audio บทสนทนาเต็มได้, จับ tone ผู้พูด, รับ instruction ภาษาธรรมชาติ (“พูดเร็วขึ้น”, “เสียงตื่นเต้นขึ้น”), และรักษา speaker identity เดียวกันได้ใน กว่า 100 ภาษา. รองรับ voice clone จากตัวอย่างเสียง 5 ถึง 15 วินาที.

Capabilityรายละเอียด
Audio-awareฟังบทสนทนาเต็มก่อนตอบ
Voice directionNL instruction ปรับ tone
Cross-language≥ 100 ภาษา, speaker เดิม
Voice cloning5-15 วินาที sample

ใช้คู่กับ STT + LLM router เป็น end-to-end voice agent ได้.

Luma UNI-1.1 API — top 3 ของโลกใน Image Arena (Story #5)

Luma UNI-1.1

Luma เปิด API ของ UNI-1.1 กับ UNI-1.1-Max อย่างเป็นทางการ. โมเดลใช้ decoder-only autoregressive transformer ที่ process text กับ image token พร้อมกัน, มี reasoning ใน image generation, และนำ benchmark RISEBench. ใน Image Arena ของ Arena.ai, Luma ติดอันดับ 3 ของ lab ทั้งโลก. API รองรับ image generation สูงสุด 9 ภาพต่อ request.

สรุป moment นี้: คนเคยพูดว่า “1M context, ของจริงไหม” — ตอนนี้คำถามขยับไปเป็น “12M context จะใช้กับ workflow อะไร” และ “เมื่อไหร่จะเป็น 100M”. เร็วขึ้น ถูกลง ยาวขึ้น เกิดพร้อมกัน.

Coding agent กระจายลงมือถือ

ที่ผ่านมา coding agent ถูกผูกอยู่กับ desktop IDE — Cursor, Windsurf, Claude Code, OpenClaw. วันนี้สอง player ใหญ่ ByteDance กับ Augment Code ดันให้ agent หลุดจาก IDE ออกไป.

TRAE SOLO ลงมือถือ (Story #7)

TRAE SOLO mobile

ByteDance (เจ้าของ TikTok) ปล่อย TRAE SOLO mobile app บนทั้ง iOS และ Android. คุณสมบัติหลัก: sync ข้ามอุปกรณ์, สั่งจาก mobile ให้ desktop รัน.

แปลว่าอะไร — แปลว่า dev โยน task หนักก่อนเข้านอน, เปิดดูตอนเช้าจาก desktop. หรือเดินอยู่บน BTS เห็น bug ใน issue, สั่ง agent ลองแก้, กลับถึง office ดู PR. workflow แบบนี้เคยเป็น dream-state ของ “remote agent” — ตอนนี้เริ่มจริง.

ที่น่าสังเกตคือ TRAE จับมือ Starbucks แจกบัตรกาแฟให้ user ที่ดาวน์โหลดและสั่งงานครั้งแรก (5-8 พฤษภาคม) — เป็น growth play แบบ consumer ที่ไม่ค่อยเห็นในวงการ dev tool. นั่นบอกว่า ByteDance อยากให้ coding agent ใช้ง่ายระดับ consumer ไม่ใช่แค่ dev hardcore.

Augment Cosmos public preview (Story #8)

Augment Cosmos

Augment Code เปิด Augment Cosmos เป็น public preview. Cosmos คือ “agent OS for software teams” — รัน agent ทั้ง local และ cloud, ครอบทั้ง software development life cycle (SDLC: design → build → test → deploy → maintain).

จุดหลักที่ทำให้ต่างคือ:

  • Prism router — route task ไปยังโมเดลและ specialized agent ตามประเภทงาน
  • Multi-agent specialization — agent เฉพาะทาง (refactor, test, doc, review) แทนที่จะเป็น generalist agent ตัวเดียว
  • Human-at-checkpoints — design ให้คนเข้าไปกำกับเฉพาะ checkpoint สำคัญ ไม่ใช่ทุกบรรทัด

เปิดให้ user แผน MAX. นี่เป็นสัญญาณว่า Augment ไม่เล่นเกม “Cursor for individual dev” แต่เล่น “agent OS for engineering org” — เป้าหมายคือทีม enterprise.

OpenClaw 2026.5.4 (Story #10)

OpenClaw 2026.5.4

OpenClaw ปล่อย version 2026.5.4 — เน้น polish: ปรับ plugin install/update เร็วขึ้น, เร่ง Gateway startup, แก้ stability issue บน Windows กับ Discord. version นี้ยังเพิ่ม Twilio + Realtime Gemini integration ที่ developer หลายคนรอ.

ทีมยืนยันว่า StableClaw long-term support version จะออกปลายเดือนพฤษภาคม. ใครใช้ OpenClaw ใน production ที่ต้องการ stability สูง — รอ StableClaw ดีกว่า main release ที่ ship ทุกสัปดาห์.

สรุป moment นี้: coding agent กำลัง mature ออกจาก IDE plugin ไปเป็น OS-level workflow. mobile-first, multi-device, multi-agent. ใครยังคิดว่า “coding agent = Cursor + Claude Code” — view นั้นเก่าไปครึ่งปี.

Google ส่ง dev tool รัวๆ

วันนี้ Google ปล่อย 6 ข่าวที่บอกตรงๆ ว่ากำลังเร่งทุก surface — IDE, RAG infra, productivity, marketing, finance UI, model preview.

AI Studio Vibe Coding + Nano Banana (Story #6)

AI Studio Vibe Coding

Google AI Studio อัปเกรด Vibe Coding ครั้งใหญ่ — เปิด edit mode ใหม่ที่ user annotate component ตรง preview แล้วแก้ได้เลย, และรวม Nano Banana image generation เข้าในตัว. ตอน generate app, ระบบจะสร้าง custom image asset ให้อัตโนมัติ — ไม่ต้อง upload ภาพ placeholder เอง.

นั่นแปลว่า Vibe Coding ไม่ใช่ scaffolding tool แล้ว, แต่เริ่มเป็น UI ที่ non-developer ก็ใช้สั่ง Google สร้าง app ได้.

Gemini API File Search อัปเกรด multimodal RAG (Story #9)

Gemini API File Search

Google ปล่อย 3 ฟีเจอร์ใหม่ใน Gemini API File Search:

  1. Multimodal search ผ่าน Gemini Embedding 2 — search ข้ามรูป + text ใน folder เดียว
  2. Custom metadata filter — filter ตาม tag, date, source
  3. Page-precise citation — อ้างกลับมาเป็น page number เฉพาะจุด

ทำให้ทีม dev สร้าง chatbot ที่อ่าน contract หรือ research paper แล้วระบุ page ตรงจุดได้ — production-ready RAG ไม่ต้องประกอบ pipeline เอง.

NotebookLM Mind Maps อัปเกรด + ยืนยัน mobile app (Story #12)

NotebookLM Mind Maps

Google NotebookLM อัปเกรด Mind Maps ครั้งใหญ่ — ตอนนี้ user prompt ปรับ scope ของ mind map ได้ (“ทำ mind map เฉพาะส่วน chapter 3”, “เน้นเรื่อง compliance”), rename + share map ได้, animation node navigation ลื่นขึ้น. และทีม ยืนยันว่า NotebookLM mobile app กำลังพัฒนาอยู่ — เป็นสิ่งที่ user รอมาเป็นปี.

Google Finance — AI Key Moments (Story #13)

Google Finance Key Moments

Google Finance beta เปิด AI-driven Key Moments — ดู stock chart 1 เดือนขึ้นไป, AI จะ mark เหตุการณ์สำคัญ (earnings beat, M&A, regulatory news) และอธิบายว่าทำไมราคาขยับ. คลิกได้ตรงไปยัง earnings call segment ที่เกี่ยวข้อง — ไม่ต้องเปิด search หาเอง. เป็น tool ที่ dev ทำ fintech น่าจะอยากเอาไป inspire UX.

Pomelli Catalog ฟรีทั่วโลก (Story #14)

Pomelli Catalog

Google Labs เปิด Pomelli Catalog ฟรีให้ทุกคนทั่วโลก. เข้าใช้ที่ labs.google.com/pomelli. user ใส่ข้อมูล product/service, agent จะ generate marketing campaign และ studio-quality image ตาม brand DNA — สำหรับ small business ที่ไม่มี marketing team. นี่เป็น experiment ของ Google ที่บอกว่าเขาจริงจังเรื่อง small biz tooling ไม่ใช่แค่ enterprise.

ลือ — Gemini 3.2 Flash โผล่ใน iOS app (Story #19)

Gemini 3.2 Flash leak

มี user หลายคน screenshot ว่า model ที่ตั้งชื่อ Gemini 3.2 Flash โผล่ใน Gemini iOS app และ AI Studio แล้วหายไปอย่างรวดเร็ว — ทำให้ชุมชนเดาว่าเป็น early gray test หรือ UI leak. user ที่ทดลองได้บอกว่าแรงใกล้เคียง Gemini 3.1 Pro — ถ้าเป็น Flash class จริง นั่นเป็น price/performance jump ใหญ่.

สรุป moment นี้: Google กำลังกระจายไปทุก surface — IDE (AI Studio), RAG infra (File Search), knowledge work (NotebookLM), consumer finance (G Finance), small biz (Pomelli), และยัง preview model ใหม่. ฝั่ง Google ยังเดินเร็วมาก.

Claude วางหมาก enterprise finance

Claude Finance Agent Templates (Story #11)

Claude finance agents

Anthropic ปล่อย agent template สำหรับ financial services industry ครั้งใหญ่ — pre-built template สำหรับ:

  • Investment banking pitch deck — งานเตรียม deck สำหรับ pitch
  • Valuation review — ทบทวน valuation model
  • Month-end close — ปิดบัญชีรายเดือน
  • Credit underwriting — ประเมินสินเชื่อ
  • KYC screening — Know Your Customer compliance
  • Reconciliation — กระทบยอด

template ฝัง connector กับ sub-agent มาพร้อม, ติดตั้งเป็น plugin ใน Claude Cowork หรือ Claude Code ได้ทันที, หรือรันเป็น production บน Managed Agents ตรงๆ. ที่สำคัญคือ — Anthropic ยืนยันว่ามีสถาบันการเงินหลายเจ้าใช้ใน production แล้ว ไม่ใช่ proof-of-concept.

นี่คือ playbook ตรงข้ามกับ OpenAI × PwC: OpenAI ใช้ partner ใหญ่ (Big 4 consulting) เป็น distribution. Anthropic เลือก ship template ตรงให้ทีม finance ใช้เอง. สองค่ายเข้า enterprise CFO เซ็กเมนต์เดียวกันแต่ทาง strategy ต่างกันชัดเจน.

สรุป moment นี้: enterprise AI ไม่ใช่ POC อีกแล้ว. ทั้ง OpenAI และ Anthropic กำลังตีตลาด CFO/finance ที่ deal value สูง — ใครชนะที่นี่จะได้ revenue base ที่ stable สุดของวงการ.

สรุปวันนี้

วันนี้สรุปได้สั้นๆ:

  1. OpenAI ขยับเป็น full-stack platform company — model + ad + finance services + ลือ hardware. ใครพึ่ง OpenAI API หนักๆ ต้องเริ่มคิดเรื่อง diversification และ cost (token price ขึ้น 49-92%).
  2. Context window 12M token เป็นของจริง — Subquadratic SubQ + Gemma 4 MTP drafter บอกตรงๆ ว่า “ถูกขึ้น เร็วขึ้น ยาวขึ้น” เกิดพร้อมกัน.
  3. Coding agent ออกจาก IDE — TRAE SOLO ลงมือถือ, Augment Cosmos เป็น agent OS. ใครยัง view ว่า coding agent = IDE plugin — view เก่าไปครึ่งปี.
  4. Google ปล่อย dev stack ครบทุก surface — เร่งทุก layer พร้อมกัน.
  5. Claude finance template ขึ้น production — enterprise AI พ้น POC แล้ว.

ถ้าจำได้แค่เรื่องเดียววันนี้ — OpenAI ไม่ใช่บริษัทโมเดลแล้ว. และ context window 12 ล้าน เริ่มเป็นของจริง.

Action items

  • ทำทันที: ลอง GPT-5.5 Instant ใน ChatGPT (default แล้ว); ตรวจ memory sources ว่าจำอะไรของเรา
  • ⚠️ ระวัง: ถ้าใช้ GPT-5.x ผ่าน API หนักๆ คำนวณ cost ใหม่ก่อน auto-upgrade — แพงขึ้น 49-92%
  • ได้ฟรี: Pomelli Catalog (labs.google.com/pomelli) เปิดทั่วโลก; Gemma 4 + MTP drafter open-source
  • 🔄 ถ้าทำ RAG: ลอง Gemini API File Search ใหม่ (multimodal + page citation)
  • 🚀 ถ้าทำ coding agent: ลอง TRAE SOLO mobile หรือ Augment Cosmos preview
  • รอดู: SubQ early access (12M context); StableClaw LTS ปลายเดือน; Gemini 3.2 Flash; OpenAI AI phone 2027

แหล่งข้อมูล

Confidence: ระดับสูง (verified จาก primary source ส่วนใหญ่). #19 Gemini 3.2 Flash + #20 AI phone เป็นข่าวลือชัดเจน, ไม่มี official statement.