index

Computer Vision

Computer Vision คือ แขนงหนึ่งของวิทยาการปัญญาประดิษฐ์ หรือ AI โดยการสร้างอวัยวะที่เสมือนดวงตาให้คอมพิวเตอร์หรือระบบ ทำให้สามารถจดจำ เข้าใจ และวิเคราะห์ข้อมูลภาพได้ เช่น รูปภาพนิ่ง วิดีโอ หรืออินพุตต่างๆ ที่เน้นด้านภาพเป็นหลัก ได้อย่างชาญฉลาด แม่นยำ และตอบสนองต่อข้อมูลภาพที่มองเห็นได้อย่างรวดเร็ว โดย Computer Vision เริ่มต้นขึ้นในปี ค.ศ. 1950 จากการใช้ Neural Network ในการจัดหมวดหมู่ให้แก่รูปทรงอย่างง่ายๆ เช่น รูปทรงสามเหลี่ยม สี่เหลี่ยม วงกลม ด้วยการค้นหาขอบและมุม ซึ่งยังไม่แม่นยำและผิดพลาดสูง ในปี ค.ศ. 1970 ได้มีการนำเอาเทคนิคประมวลผลที่เรียกว่า Optical Character Recognition มาใช้ในการตีความตัวหนังสือหรือข้อความ และมีการพัฒนาอย่างรวดเร็ว ในปี ค.ศ. 1990 เมื่อมีการพัฒนาของระบบอินเทอร์เน็ต จึงมีการอัปโหลดข้อมูลรูปภาพต่างๆ อยู่ตลอดเวลาจำนวนมหาศาล ทำให้สามารถวิเคราะห์ข้อมูลและจดจำภาพถ่ายได้จำนวนมาก ระหว่างปี ค.ศ. 2000-2001 มีการศึกษาด้านการตรวจจับวัตถุมากยิ่งขึ้น ส่งผลทำให้เกิดการพัฒนาการตรวจจับใบหน้าแบบเรียลไทม์เป็นครั้งแรก

Placeholder image

หลักการทำงาน

-การจับภาพ สามารถนำข้อมูลภาพต่างๆ จำนวนมากเข้าระบบได้ ผ่านทางภาพถ่าย วิดีโอ หรือภาพสามมิติ เพื่อให้ระบบนำไปวิเคราะห์ข้อมูล เป็นการสอนให้คอมพิวเตอร์เรียนรู้และวิเคราะห์ภาพได้อย่างแม่นยำ จึงต้องใส่ข้อมูลภาพจำนวนมาก รวมถึงภาพที่มีความเกี่ยวข้องกัน เพื่อให้แยกแยะความแตกต่าง

-การประมวลภาพ หลังจากมีการนำเข้าข้อมูลภาพแล้ว เทคโนโลยี Deep Learning และ Convolutional Neural Networks จะถูกนำมาใช้ในขั้นตอนนี้ โดยการใช้โครงข่ายประสาทเทียมประมวลผลและจัดเรียงข้อมูลภาพด้านต่างๆ โดยอัตโนมัติ ส่วนของ Convolutional Neural Networks จะช่วยให้ Deep Learning มองเห็นและเข้าใจภาพมากยิ่งขึ้นด้วยการแยกคุณลักษณะต่างๆ ของภาพ เช่น เส้นขอบ พื้นผิว รูปร่างเอาไว้ในแต่ละ Convolutional Layers และติดป้ายกำกับเอาไว้ เมื่อ Layer จดจำคุณลักษณะต่างๆ รวมกัน ทำให้โมเดลสามารถเรียนรู้และจดจำภาพที่มีความซับซ้อนได้อย่างรวดเร็วและแม่นยำมากยิ่งขึ้น

-จดจำ ทำความเข้าใจ วิเคราะห์ตีความหมาย ตีความหมายภาพที่ได้จากการวิเคราะห์ โดยจะระบุชนิดและจัดประเภทของภาพที่ได้จากการวิเคราะห์นั้น

Placeholder image

Placeholder image