ไขข้อสงสัย "AI สร้างภาพได้อย่างไร?"
ไขข้อสงสัย "AI สร้างภาพได้อย่างไร?" : เพื่อนๆเคยลองเล่นเครื่องมือสร้างภาพอย่าง Midjourney หรือ DALL-E กันบ้างรึยัง? หลายคนเคยได้ลองแล้ว หลายคนใช้งานอยู่ และหลายคนน่าจะเคยเกิดคำถามในใจใช่ไหมครับว่า... "ตกลงแล้วมันทำได้ยังไง?"
AIสร้างภาพด้วยAI
ภัทร
1/8/2026
วันนี้ผมจะพาไปถอดรหัสเบื้องหลังการทำงานของ AI แบบฉบับเข้าใจง่าย (ไม่ต้องจบวิศวะคอมฯ ก็เข้าใจได้) มาดูกันครับว่าศิลปินดิจิทัลคนนี้เขามีวิธีคิดงานอย่างไร
1. เลิกเข้าใจผิด! มันไม่ได้ "ก๊อป-วาง" (Copy-Paste)
ความเข้าใจผิดอันดับ 1 คือ คนมักคิดว่า AI ไปค้นรูปใน Google มาเป็นล้านๆ รูป แล้วเอาขาคนนั้นมาแปะตัวคนนี้ เอาหัวแมวมาแปะตัวหมา... แต่ความจริงไม่ใช่แบบนั้นครับ!
AI ไม่ได้เก็บรูปภาพต้นฉบับไว้ในตัวมันเลย (เพราะไฟล์จะใหญ่จนเก็บไม่ไหว) แต่มันเก็บ "ความรู้" หรือ "ความเข้าใจ" เกี่ยวกับรูปภาพต่างหาก
เปรียบเทียบง่ายๆ: เหมือนคุณไปเรียนวาดรูป คุณดูรูปนกมาเป็นพันตัว คุณไม่ได้จำนกทุกตัวได้เป๊ะๆ แต่คุณจำ "คอนเซปต์" ได้ว่า นกต้องมีปีก มีจงอยปาก มีขน และเกาะกิ่งไม้... AI ก็ทำแบบเดียวกันครับ มันเรียนรู้คอนเซปต์ จนมันสามารถวาดนกตัวใหม่ที่ไม่เคยมีอยู่จริงบนโลกขึ้นมาได้
2. การเรียนรู้ของ AI (Training)
ก่อนที่มันจะเก่งขนาดนี้ AI ต้องผ่านการเข้าคอร์สฝึกโหดที่เรียกว่า "Machine Learning" ครับ
ผู้พัฒนาจะป้อนข้อมูลให้มันดูมหาศาล (หลักพันล้านภาพ) โดยแต่ละภาพจะมีคำบรรยายแปะไว้ เช่น:
ส่งรูป "แอปเปิ้ล" ให้ดู พร้อมบอกว่า นี่คือ "Apple"
ส่งรูป "แอปเปิ้ลสีเขียว" ให้ดู พร้อมบอกว่า นี่คือ "Green Apple"
ทำแบบนี้ซ้ำๆ จน AI เริ่มจับจุดได้ว่า รูปทรงกลมๆ สีแดงๆ มีก้าน คือแอปเปิ้ล และถ้ามีคำว่า "สีเขียว" ต้องเปลี่ยนค่าสีไปเป็นอีกแบบ มันเรียนรู้ความสัมพันธ์ระหว่าง "ภาพ" และ "คำ" จนเชื่อมโยงกันได้หมด
3. เทคนิค "Diffusion Model": จากฝุ่นผง สู่ภาพสวย
นี่คือหัวใจสำคัญของ AI ยุคใหม่ (อย่าง Midjourney หรือ Stable Diffusion) ครับ เขาใช้วิธีที่เรียกว่า Diffusion Model
ลองจินตนาการถึงหน้าจอทีวีสมัยก่อนที่ไม่มีสัญญาณ ที่เป็นจุดซ่าๆ (Noise) ขาวๆ ดำๆ ดูไม่รู้เรื่อง นั่นแหละครับคือจุดเริ่มต้นของภาพวาด AI
กระบวนการทำงานคือ:
เริ่มจากความว่างเปล่า: AI จะสร้างแผ่นภาพที่มีแต่จุดซ่าๆ (Noise) ขึ้นมา
ฟังคำสั่ง: เมื่อคุณพิมพ์ว่า "หมาป่าท่ามกลางหิมะ"
ค่อยๆ เกลี่ย: AI จะค่อยๆ ลบจุดรบกวนออก (De-noising) ทีละนิดๆ โดยพยายามจัดเรียงจุดสีเหล่านั้นให้กลายเป็นรูปร่างของ "หมาป่า" และ "หิมะ" ตามที่มันเคยเรียนรู้มา
ชัดขึ้นเรื่อยๆ: ผ่านไปไม่กี่วินาที จากจุดมั่วๆ จะเริ่มเห็นเป็นโครงร่าง เป็นขนสัตว์ เป็นดวงตา และกลายเป็นภาพที่คมชัดในที่สุด
เหมือนกับการที่เรามองก้อนเมฆ (ที่ไม่มีรูปร่าง) แล้วจินตนาการว่า "นั่นเหมือนหมาป่าเลย" แล้วเราก็ค่อยๆ วาดเส้นเติมลงไปจนมันเป็นหมาป่าจริงๆ ครับ
4. ตัวแปลภาษา (Text Encoder)
อีกส่วนที่ขาดไม่ได้คือ "ล่าม" ครับ เพราะ AI (ส่วนที่วาดรูป) มันคุยภาษาคนไม่รู้เรื่อง มันคุยรู้เรื่องแต่ตัวเลข
เมื่อเราพิมพ์ Prompt ว่า "Astronaut riding a horse" (นักบินอวกาศขี่ม้า) จะมี AI อีกส่วนหนึ่งทำหน้าที่แปลงประโยคนี้ให้เป็น "ชุดตัวเลข" (Vectors) ที่ระบุพิกัดความหมาย เช่น:
เลขชุดนี้ = นักบินอวกาศ (ชุดขาว, หมวกกลม, อวกาศ)
เลขชุดนี้ = ม้า (สัตว์ 4 ขา, มีหาง)
เลขชุดนี้ = การขี่ (อยู่ด้านบน, คร่อม)
เจ้ารหัสตัวเลขพวกนี้แหละครับ คือพิมพ์เขียวที่ส่งไปบอกให้ตัววาดรูป (Diffusion Model) ทำงานได้อย่างถูกต้อง
สรุปสั้นๆ: กระบวนการสร้างภาพใน 3 วินาที
คุณพิมพ์สั่ง: "แมวนอนบนเปียโน"
ตัวแปลภาษา: แปลงคำสั่งเป็นรหัสคณิตศาสตร์
ตัวสร้างภาพ: เริ่มต้นจากภาพจุดซ่าๆ (Noise) แล้วค่อยๆ เกลี่ยจุดเหล่านั้นโดยอ้างอิงจากรหัสที่ได้รับ จนจุดสีรวมตัวกันกลายเป็นรูปแมวและเปียโน
ผลลัพธ์: ได้ภาพใหม่ 100% ที่ไม่ซ้ำกับใครในโลก!
พอเรารู้หลักการทำงานแบบนี้แล้ว จะเห็นว่า AI ไม่ใช่เวทมนตร์ไสยศาสตร์ แต่เป็น "คณิตศาสตร์" และ "สถิติ" ล้วนๆ เลยครับ
การเข้าใจหลักการนี้มีข้อดีคือ ทำให้เรารู้ว่า "Prompt" สำคัญแค่ไหน เพราะถ้าเราป้อนคำสั่งไม่ชัดเจน AI ก็จะไม่รู้ว่าจะเกลี่ยจุดสีเหล่านั้นไปทางทิศทางไหนดี หวังว่าบทความนี้จะช่วยให้เพื่อนๆ มองภาพ AI ได้ทะลุปรุโปร่งขึ้น และสนุกกับการสร้างสรรค์งานศิลปะยุคใหม่นะครับ!
