Data Science
จริง ๆ เรื่อง Data Science ไม่ได้พึ่งจะมาพูดถึงกันใน ค.ศ. นี้หรอกนะ แต่พูดกันมานานแล้ว โดย John W. Tukey ได้เขียนบทความที่ชื่อ “The Future of Data Analysis” ในปี 1962 จากนั้นก็มีการถกเถียงแลกเปลี่ยนของนักเทคโนโลยีและนักวิทยาศาสตร์กันมาตลอด มีหนังสือและบทความออกมามากมายนับไม่ถ้วน
แต่ในยุคปัจจุบันที่เทคโนโลยีเติบโตขึ้นราวกับดอกเห็ดที่ได้รับน้ำฝนเดือนเจ็ด ทำให้รอบตัวเราเต็มไปด้วยข้อมูลที่เอ่อล้นกว่ายุคก่อนหลายเท่ามาก เรื่องนี้จึงกลับมาเป็นประเด็นให้พูดถึงกันอีกครั้ง โดยไม่จำกัดเพียงแค่กลุ่มคนด้าน IT แต่รวมไปถึงภาคธุรกิจและคนทั่วไปด้วย
เอาล่ะ…เข้าเรื่องกันเลยดีกว่า!
วิทยาการข้อมูล (Data Science) พูดแบบภาษาทั่วไป มันก็คือศาสตร์ประเภทหนึ่งที่ผนวกเอาความรู้ด้านเทคโนโลยีหลายอย่างเข้าไปศึกษาสิ่งที่เรียกว่า “ข้อมูล (Data)” ที่มีจำนวนมหาศาล ซึ่งข้อมูลดังกล่าวยังไม่ได้ถูกจัดเรียงและวิเคราะห์อย่างเป็นระบบ แต่กองเป็นพะเนินเทินทึก ดังนั้นก็เป็นหน้าที่ของศาสตร์ Data Science ที่จะเข้าไปจัดการกับข้อมูลเหล่านั้นเพื่อให้ได้ความรู้อย่างหนึ่งอย่างใดออกมา
สำหรับความรู้ที่ใช้ในการศึกษาด้าน Data Science ได้แก่
- Data Mining
- Machine Learning
- Deep Learning
- Artificial Intelligence (AI)
- Big Data
- Math & Statistics
แล้วสงสัยกันไหมว่าทำไมมันถึง “เซ็กซี่” ที่สุดในเวลานี้?
คำตอบก็คือว่า ในทุก ๆ วันมีข้อมูลไหลเวียนอยู่รอบตัวเราเป็นจำนวนมาก ไม่ว่าจะเป็นภาพถ่าย วิดีโอ เพลง อีเมลข้อมูลการเข้าชมเว็บไซต์ ข้อมูลด้านการเงิน ข้อมูลด้านการตลาด ฯลฯ เรียกได้ว่าสาธยายทั้งวันก็ไม่หมด ซึ่งข้อมูลเหล่านี้ถือว่าเป็น “สิ่งล้ำค่า” สำหรับภาคธุรกิจ ดังนั้นบริษัทใหญ่ ๆ จำนวนมาก จึงต้องการคนที่จะมาช่วยพวกเขาวิเคราะห์ข้อมูลพวกนี้ เพื่อให้ได้ข้อมูลบางอย่างออกมา เช่น พฤติกรรมการซื้อของชองลูกค้า ปัจจัยที่ส่งผลให้ลูกค้าตัดสินใจซื้อ หรือเทรนด์ต่าง ๆ ที่มีแนวโน้มที่จะเกิดขึ้นในอนาคต และอื่น ๆ อีกมากมาย เป็นต้น ซึ่งแน่นอนว่าข้อมูลดังกล่าวนั้นเป็นประโยชน์ต่อบริษัทเป็นอย่างมากในการปรับกลยุทธ์ วางแผนการตลาด หรือการปรับปรุงการให้บริการ
โดยอาชีพที่จะมารับหน้าที่อันยิ่งใหญ่นี้มีคือ นักวิทยาศาสตร์ข้อมูล (Data Scientist) ซึ่งตอนนี้เรียกได้ว่า “เนื้อหอม” เอามาก ๆ เพราะคนที่มีความเชี่ยวชาญด้านดังกล่าวในปัจจุบันยังมีจำนวนค่อนข้างน้อย บริษัทต่าง ๆ จึงพร้อมที่จ่ายค่าจ้างที่สูง-สูงมาก เพื่อให้ได้คนเหล่านี้มาทำงานให้กับองค์กร
แล้วการเป็นนักวิทยาศาสตร์ข้อมูล (Data Scientist) ต้องมีความรู้อะไรบ้าง?
คนที่จะทำงานเป็นนักวิทยาศาสตร์ข้อมูลได้ ต้องประกอบด้วยทักษะและความรู้เบื้องต้น ดังนี้
- ใช้เครื่องมือพื้นฐานจำพวก R, Python และ SQL ได้
- มีความเข้าใจพื้นฐานด้านสถิติ (Statistics)
- เข้าใจการทำงานของ Machine Learning, Data Mining และ Big Data อย่างลึกซึ้ง
- มีความสามารถในการหาตัวแปรค่าต่างๆ ในแคลคูลัส และเส้นแอลจีบร้า
- แจกแจงและจำแนกข้อมูลได้ (Data Munging)
- เข้าใจเรื่อง Data Visualization & Communication
- มีความรู้ด้านวิศวกรรมซอฟต์แวร์ (Software Engineering)
- คิดแบบนักวิทยาศาตร์ข้อมูลเป็น (Think Like A Data Scientist)
อันที่จริงเรื่อง Data Science รวมถึงการเป็น Data Scientist นั้นมีรายละเอียดยิบย่อยอีกเป็นจำนวนมาก หากท่านใดสนใจเรื่องนี้และอยากหาข้อมูลเพิ่มเติม ผมจะแนบลิงก์ไว้ให้ แล้วก็ขอบคุณที่อ่านจนจบครับ
ลิงก์อ่านเพิ่มเติม
- บทความจาก theinfofactory
- ประวัติศาสตร์ฉบับย่อของ Data Science
- 8 ขั้นตอนในการเรียนรู้เกี่ยวกับ Data Science
บทความของ Bossup Solution อื่น ๆ ที่เกี่ยวข้อง