Data Science

จริง ๆ เรื่อง Data Science ไม่ได้พึ่งจะมาพูดถึงกันใน ค.ศ. นี้หรอกนะ แต่พูดกันมานานแล้ว โดย John W. Tukey ได้เขียนบทความที่ชื่อ “The Future of Data Analysis” ในปี 1962 จากนั้นก็มีการถกเถียงแลกเปลี่ยนของนักเทคโนโลยีและนักวิทยาศาสตร์กันมาตลอด มีหนังสือและบทความออกมามากมายนับไม่ถ้วน

แต่ในยุคปัจจุบันที่เทคโนโลยีเติบโตขึ้นราวกับดอกเห็ดที่ได้รับน้ำฝนเดือนเจ็ด ทำให้รอบตัวเราเต็มไปด้วยข้อมูลที่เอ่อล้นกว่ายุคก่อนหลายเท่ามาก เรื่องนี้จึงกลับมาเป็นประเด็นให้พูดถึงกันอีกครั้ง โดยไม่จำกัดเพียงแค่กลุ่มคนด้าน IT แต่รวมไปถึงภาคธุรกิจและคนทั่วไปด้วย

เอาล่ะ…เข้าเรื่องกันเลยดีกว่า!

วิทยาการข้อมูล (Data Science) พูดแบบภาษาทั่วไป มันก็คือศาสตร์ประเภทหนึ่งที่ผนวกเอาความรู้ด้านเทคโนโลยีหลายอย่างเข้าไปศึกษาสิ่งที่เรียกว่า “ข้อมูล (Data)” ที่มีจำนวนมหาศาล ซึ่งข้อมูลดังกล่าวยังไม่ได้ถูกจัดเรียงและวิเคราะห์อย่างเป็นระบบ แต่กองเป็นพะเนินเทินทึก ดังนั้นก็เป็นหน้าที่ของศาสตร์ Data Science ที่จะเข้าไปจัดการกับข้อมูลเหล่านั้นเพื่อให้ได้ความรู้อย่างหนึ่งอย่างใดออกมา

สำหรับความรู้ที่ใช้ในการศึกษาด้าน Data Science ได้แก่

  • Data Mining
  • Machine Learning
  • Deep Learning
  • Artificial Intelligence (AI)
  • Big Data
  • Math & Statistics

แล้วสงสัยกันไหมว่าทำไมมันถึง “เซ็กซี่” ที่สุดในเวลานี้?

คำตอบก็คือว่า ในทุก ๆ วันมีข้อมูลไหลเวียนอยู่รอบตัวเราเป็นจำนวนมาก ไม่ว่าจะเป็นภาพถ่าย วิดีโอ เพลง อีเมลข้อมูลการเข้าชมเว็บไซต์ ข้อมูลด้านการเงิน ข้อมูลด้านการตลาด ฯลฯ เรียกได้ว่าสาธยายทั้งวันก็ไม่หมด ซึ่งข้อมูลเหล่านี้ถือว่าเป็น “สิ่งล้ำค่า” สำหรับภาคธุรกิจ ดังนั้นบริษัทใหญ่ ๆ จำนวนมาก จึงต้องการคนที่จะมาช่วยพวกเขาวิเคราะห์ข้อมูลพวกนี้ เพื่อให้ได้ข้อมูลบางอย่างออกมา เช่น พฤติกรรมการซื้อของชองลูกค้า ปัจจัยที่ส่งผลให้ลูกค้าตัดสินใจซื้อ หรือเทรนด์ต่าง ๆ ที่มีแนวโน้มที่จะเกิดขึ้นในอนาคต และอื่น ๆ อีกมากมาย เป็นต้น ซึ่งแน่นอนว่าข้อมูลดังกล่าวนั้นเป็นประโยชน์ต่อบริษัทเป็นอย่างมากในการปรับกลยุทธ์ วางแผนการตลาด หรือการปรับปรุงการให้บริการ

โดยอาชีพที่จะมารับหน้าที่อันยิ่งใหญ่นี้มีคือ นักวิทยาศาสตร์ข้อมูล (Data Scientist) ซึ่งตอนนี้เรียกได้ว่า “เนื้อหอม” เอามาก ๆ เพราะคนที่มีความเชี่ยวชาญด้านดังกล่าวในปัจจุบันยังมีจำนวนค่อนข้างน้อย บริษัทต่าง ๆ จึงพร้อมที่จ่ายค่าจ้างที่สูง-สูงมาก เพื่อให้ได้คนเหล่านี้มาทำงานให้กับองค์กร

แล้วการเป็นนักวิทยาศาสตร์ข้อมูล (Data Scientist) ต้องมีความรู้อะไรบ้าง?

คนที่จะทำงานเป็นนักวิทยาศาสตร์ข้อมูลได้ ต้องประกอบด้วยทักษะและความรู้เบื้องต้น ดังนี้

  • ใช้เครื่องมือพื้นฐานจำพวก R, Python และ SQL ได้
  • มีความเข้าใจพื้นฐานด้านสถิติ (Statistics)
  • เข้าใจการทำงานของ Machine Learning, Data Mining และ Big Data อย่างลึกซึ้ง
  • มีความสามารถในการหาตัวแปรค่าต่างๆ ในแคลคูลัส และเส้นแอลจีบร้า
  • แจกแจงและจำแนกข้อมูลได้ (Data Munging)
  • เข้าใจเรื่อง Data Visualization & Communication
  • มีความรู้ด้านวิศวกรรมซอฟต์แวร์ (Software Engineering)
  • คิดแบบนักวิทยาศาตร์ข้อมูลเป็น (Think Like A Data Scientist)

อันที่จริงเรื่อง Data Science รวมถึงการเป็น Data Scientist นั้นมีรายละเอียดยิบย่อยอีกเป็นจำนวนมาก หากท่านใดสนใจเรื่องนี้และอยากหาข้อมูลเพิ่มเติม ผมจะแนบลิงก์ไว้ให้ แล้วก็ขอบคุณที่อ่านจนจบครับ

ลิงก์อ่านเพิ่มเติม

บทความของ Bossup Solution อื่น ๆ ที่เกี่ยวข้อง

Recent Posts
Contact Us

We're not around right now. But you can send us an email and we'll get back to you, asap.

Start typing and press Enter to search