Data Science

จริง ๆ เรื่อง Data Science ไม่ได้พึ่งจะมาพูดถึงกันใน ค.ศ. นี้หรอกนะ แต่พูดกันมานานแล้ว โดย John W. Tukey ได้เขียนบทความที่ชื่อ “The Future of Data Analysis” ในปี 1962 จากนั้นก็มีการถกเถียงแลกเปลี่ยนของนักเทคโนโลยีและนักวิทยาศาสตร์กันมาตลอด มีหนังสือและบทความออกมามากมายนับไม่ถ้วน

แต่ในยุคปัจจุบันที่เทคโนโลยีเติบโตขึ้นราวกับดอกเห็ดที่ได้รับน้ำฝนเดือนเจ็ด ทำให้รอบตัวเราเต็มไปด้วยข้อมูลที่เอ่อล้นกว่ายุคก่อนหลายเท่ามาก เรื่องนี้จึงกลับมาเป็นประเด็นให้พูดถึงกันอีกครั้ง โดยไม่จำกัดเพียงแค่กลุ่มคนด้าน IT แต่รวมไปถึงภาคธุรกิจและคนทั่วไปด้วย

เอาล่ะ…เข้าเรื่องกันเลยดีกว่า!

วิทยาการข้อมูล (Data Science) พูดแบบภาษาทั่วไป มันก็คือศาสตร์ประเภทหนึ่งที่ผนวกเอาความรู้ด้านเทคโนโลยีหลายอย่างเข้าไปศึกษาสิ่งที่เรียกว่า “ข้อมูล (Data)” ที่มีจำนวนมหาศาล ซึ่งข้อมูลดังกล่าวยังไม่ได้ถูกจัดเรียงและวิเคราะห์อย่างเป็นระบบ แต่กองเป็นพะเนินเทินทึก ดังนั้นก็เป็นหน้าที่ของศาสตร์ Data Science ที่จะเข้าไปจัดการกับข้อมูลเหล่านั้นเพื่อให้ได้ความรู้อย่างหนึ่งอย่างใดออกมา

สำหรับความรู้ที่ใช้ในการศึกษาด้าน Data Science ได้แก่

  • Data Mining
  • Machine Learning
  • Deep Learning
  • Artificial Intelligence (AI)
  • Big Data
  • Math & Statistics

แล้วสงสัยกันไหมว่าทำไมมันถึง “เซ็กซี่” ที่สุดในเวลานี้?

คำตอบก็คือว่า ในทุก ๆ วันมีข้อมูลไหลเวียนอยู่รอบตัวเราเป็นจำนวนมาก ไม่ว่าจะเป็นภาพถ่าย วิดีโอ เพลง อีเมลข้อมูลการเข้าชมเว็บไซต์ ข้อมูลด้านการเงิน ข้อมูลด้านการตลาด ฯลฯ เรียกได้ว่าสาธยายทั้งวันก็ไม่หมด ซึ่งข้อมูลเหล่านี้ถือว่าเป็น “สิ่งล้ำค่า” สำหรับภาคธุรกิจ ดังนั้นบริษัทใหญ่ ๆ จำนวนมาก จึงต้องการคนที่จะมาช่วยพวกเขาวิเคราะห์ข้อมูลพวกนี้ เพื่อให้ได้ข้อมูลบางอย่างออกมา เช่น พฤติกรรมการซื้อของชองลูกค้า ปัจจัยที่ส่งผลให้ลูกค้าตัดสินใจซื้อ หรือเทรนด์ต่าง ๆ ที่มีแนวโน้มที่จะเกิดขึ้นในอนาคต และอื่น ๆ อีกมากมาย เป็นต้น ซึ่งแน่นอนว่าข้อมูลดังกล่าวนั้นเป็นประโยชน์ต่อบริษัทเป็นอย่างมากในการปรับกลยุทธ์ วางแผนการตลาด หรือการปรับปรุงการให้บริการ

โดยอาชีพที่จะมารับหน้าที่อันยิ่งใหญ่นี้มีคือ นักวิทยาศาสตร์ข้อมูล (Data Scientist) ซึ่งตอนนี้เรียกได้ว่า “เนื้อหอม” เอามาก ๆ เพราะคนที่มีความเชี่ยวชาญด้านดังกล่าวในปัจจุบันยังมีจำนวนค่อนข้างน้อย บริษัทต่าง ๆ จึงพร้อมที่จ่ายค่าจ้างที่สูง-สูงมาก เพื่อให้ได้คนเหล่านี้มาทำงานให้กับองค์กร

แล้วการเป็นนักวิทยาศาสตร์ข้อมูล (Data Scientist) ต้องมีความรู้อะไรบ้าง?

คนที่จะทำงานเป็นนักวิทยาศาสตร์ข้อมูลได้ ต้องประกอบด้วยทักษะและความรู้เบื้องต้น ดังนี้

  • ใช้เครื่องมือพื้นฐานจำพวก R, Python และ SQL ได้
  • มีความเข้าใจพื้นฐานด้านสถิติ (Statistics)
  • เข้าใจการทำงานของ Machine Learning, Data Mining และ Big Data อย่างลึกซึ้ง
  • มีความสามารถในการหาตัวแปรค่าต่างๆ ในแคลคูลัส และเส้นแอลจีบร้า
  • แจกแจงและจำแนกข้อมูลได้ (Data Munging)
  • เข้าใจเรื่อง Data Visualization & Communication
  • มีความรู้ด้านวิศวกรรมซอฟต์แวร์ (Software Engineering)
  • คิดแบบนักวิทยาศาตร์ข้อมูลเป็น (Think Like A Data Scientist)

อันที่จริงเรื่อง Data Science รวมถึงการเป็น Data Scientist นั้นมีรายละเอียดยิบย่อยอีกเป็นจำนวนมาก หากท่านใดสนใจเรื่องนี้และอยากหาข้อมูลเพิ่มเติม ผมจะแนบลิงก์ไว้ให้ แล้วก็ขอบคุณที่อ่านจนจบครับ

ลิงก์อ่านเพิ่มเติม

บทความของ Bossup Solution อื่น ๆ ที่เกี่ยวข้อง

Recent Posts