ไขข้อสงสัย "AI สร้างภาพได้อย่างไร?"

ไขข้อสงสัย "AI สร้างภาพได้อย่างไร?" : เพื่อนๆเคยลองเล่นเครื่องมือสร้างภาพอย่าง Midjourney หรือ DALL-E กันบ้างรึยัง? หลายคนเคยได้ลองแล้ว หลายคนใช้งานอยู่ และหลายคนน่าจะเคยเกิดคำถามในใจใช่ไหมครับว่า... "ตกลงแล้วมันทำได้ยังไง?"

AIสร้างภาพด้วยAI

ภัทร

1/8/2026

A close up of a blue eyeball in the dark
A close up of a blue eyeball in the dark

วันนี้ผมจะพาไปถอดรหัสเบื้องหลังการทำงานของ AI แบบฉบับเข้าใจง่าย (ไม่ต้องจบวิศวะคอมฯ ก็เข้าใจได้) มาดูกันครับว่าศิลปินดิจิทัลคนนี้เขามีวิธีคิดงานอย่างไร

1. เลิกเข้าใจผิด! มันไม่ได้ "ก๊อป-วาง" (Copy-Paste)

ความเข้าใจผิดอันดับ 1 คือ คนมักคิดว่า AI ไปค้นรูปใน Google มาเป็นล้านๆ รูป แล้วเอาขาคนนั้นมาแปะตัวคนนี้ เอาหัวแมวมาแปะตัวหมา... แต่ความจริงไม่ใช่แบบนั้นครับ!

AI ไม่ได้เก็บรูปภาพต้นฉบับไว้ในตัวมันเลย (เพราะไฟล์จะใหญ่จนเก็บไม่ไหว) แต่มันเก็บ "ความรู้" หรือ "ความเข้าใจ" เกี่ยวกับรูปภาพต่างหาก

เปรียบเทียบง่ายๆ: เหมือนคุณไปเรียนวาดรูป คุณดูรูปนกมาเป็นพันตัว คุณไม่ได้จำนกทุกตัวได้เป๊ะๆ แต่คุณจำ "คอนเซปต์" ได้ว่า นกต้องมีปีก มีจงอยปาก มีขน และเกาะกิ่งไม้... AI ก็ทำแบบเดียวกันครับ มันเรียนรู้คอนเซปต์ จนมันสามารถวาดนกตัวใหม่ที่ไม่เคยมีอยู่จริงบนโลกขึ้นมาได้

2. การเรียนรู้ของ AI (Training)

ก่อนที่มันจะเก่งขนาดนี้ AI ต้องผ่านการเข้าคอร์สฝึกโหดที่เรียกว่า "Machine Learning" ครับ

ผู้พัฒนาจะป้อนข้อมูลให้มันดูมหาศาล (หลักพันล้านภาพ) โดยแต่ละภาพจะมีคำบรรยายแปะไว้ เช่น:

  • ส่งรูป "แอปเปิ้ล" ให้ดู พร้อมบอกว่า นี่คือ "Apple"

  • ส่งรูป "แอปเปิ้ลสีเขียว" ให้ดู พร้อมบอกว่า นี่คือ "Green Apple"

ทำแบบนี้ซ้ำๆ จน AI เริ่มจับจุดได้ว่า รูปทรงกลมๆ สีแดงๆ มีก้าน คือแอปเปิ้ล และถ้ามีคำว่า "สีเขียว" ต้องเปลี่ยนค่าสีไปเป็นอีกแบบ มันเรียนรู้ความสัมพันธ์ระหว่าง "ภาพ" และ "คำ" จนเชื่อมโยงกันได้หมด

3. เทคนิค "Diffusion Model": จากฝุ่นผง สู่ภาพสวย

นี่คือหัวใจสำคัญของ AI ยุคใหม่ (อย่าง Midjourney หรือ Stable Diffusion) ครับ เขาใช้วิธีที่เรียกว่า Diffusion Model

ลองจินตนาการถึงหน้าจอทีวีสมัยก่อนที่ไม่มีสัญญาณ ที่เป็นจุดซ่าๆ (Noise) ขาวๆ ดำๆ ดูไม่รู้เรื่อง นั่นแหละครับคือจุดเริ่มต้นของภาพวาด AI

กระบวนการทำงานคือ:

  1. เริ่มจากความว่างเปล่า: AI จะสร้างแผ่นภาพที่มีแต่จุดซ่าๆ (Noise) ขึ้นมา

  2. ฟังคำสั่ง: เมื่อคุณพิมพ์ว่า "หมาป่าท่ามกลางหิมะ"

  3. ค่อยๆ เกลี่ย: AI จะค่อยๆ ลบจุดรบกวนออก (De-noising) ทีละนิดๆ โดยพยายามจัดเรียงจุดสีเหล่านั้นให้กลายเป็นรูปร่างของ "หมาป่า" และ "หิมะ" ตามที่มันเคยเรียนรู้มา

  4. ชัดขึ้นเรื่อยๆ: ผ่านไปไม่กี่วินาที จากจุดมั่วๆ จะเริ่มเห็นเป็นโครงร่าง เป็นขนสัตว์ เป็นดวงตา และกลายเป็นภาพที่คมชัดในที่สุด

เหมือนกับการที่เรามองก้อนเมฆ (ที่ไม่มีรูปร่าง) แล้วจินตนาการว่า "นั่นเหมือนหมาป่าเลย" แล้วเราก็ค่อยๆ วาดเส้นเติมลงไปจนมันเป็นหมาป่าจริงๆ ครับ

4. ตัวแปลภาษา (Text Encoder)

อีกส่วนที่ขาดไม่ได้คือ "ล่าม" ครับ เพราะ AI (ส่วนที่วาดรูป) มันคุยภาษาคนไม่รู้เรื่อง มันคุยรู้เรื่องแต่ตัวเลข

เมื่อเราพิมพ์ Prompt ว่า "Astronaut riding a horse" (นักบินอวกาศขี่ม้า) จะมี AI อีกส่วนหนึ่งทำหน้าที่แปลงประโยคนี้ให้เป็น "ชุดตัวเลข" (Vectors) ที่ระบุพิกัดความหมาย เช่น:

  • เลขชุดนี้ = นักบินอวกาศ (ชุดขาว, หมวกกลม, อวกาศ)

  • เลขชุดนี้ = ม้า (สัตว์ 4 ขา, มีหาง)

  • เลขชุดนี้ = การขี่ (อยู่ด้านบน, คร่อม)

เจ้ารหัสตัวเลขพวกนี้แหละครับ คือพิมพ์เขียวที่ส่งไปบอกให้ตัววาดรูป (Diffusion Model) ทำงานได้อย่างถูกต้อง

สรุปสั้นๆ: กระบวนการสร้างภาพใน 3 วินาที

  1. คุณพิมพ์สั่ง: "แมวนอนบนเปียโน"

  2. ตัวแปลภาษา: แปลงคำสั่งเป็นรหัสคณิตศาสตร์

  3. ตัวสร้างภาพ: เริ่มต้นจากภาพจุดซ่าๆ (Noise) แล้วค่อยๆ เกลี่ยจุดเหล่านั้นโดยอ้างอิงจากรหัสที่ได้รับ จนจุดสีรวมตัวกันกลายเป็นรูปแมวและเปียโน

  4. ผลลัพธ์: ได้ภาพใหม่ 100% ที่ไม่ซ้ำกับใครในโลก!

พอเรารู้หลักการทำงานแบบนี้แล้ว จะเห็นว่า AI ไม่ใช่เวทมนตร์ไสยศาสตร์ แต่เป็น "คณิตศาสตร์" และ "สถิติ" ล้วนๆ เลยครับ

การเข้าใจหลักการนี้มีข้อดีคือ ทำให้เรารู้ว่า "Prompt" สำคัญแค่ไหน เพราะถ้าเราป้อนคำสั่งไม่ชัดเจน AI ก็จะไม่รู้ว่าจะเกลี่ยจุดสีเหล่านั้นไปทางทิศทางไหนดี หวังว่าบทความนี้จะช่วยให้เพื่อนๆ มองภาพ AI ได้ทะลุปรุโปร่งขึ้น และสนุกกับการสร้างสรรค์งานศิลปะยุคใหม่นะครับ!

a person holding a cell phone in their hand
a person holding a cell phone in their hand