ถ้าวันนี้ต้องเริ่มเรียน Data Science ใหม่อีกครั้ง จะเรียนยังไง?

เริ่มเรียน Data Science ได้ง่ายๆแค่โฟกัสให้ถูกจุดก็เรียนสนุกและเป็นไว

ถ้าวันนี้ต้องเริ่มเรียน Data Science ใหม่อีกครั้ง จะเรียนยังไง?
If I had to start over - learning data science again

ขั้นตอนแรกของทุก data science projects คือการตั้งคำถามให้ดี ask good questions และชื่อ newsletter ฉบับแรกของซีรีส์นี้จะยึดมั่นใน principles นี้เช่นกัน

ถ้าวันนี้ต้องเริ่มเรียน data science ใหม่อีกครั้ง เรียนแบบไหนถึงจะ work ที่สุด?

คำถามนี้กลายเป็นจุดเริ่มต้นของหนังสือ A Humble Guide to Data Science โปรเจ็คที่เราคิดไว้นานแล้ว แต่ยังหาเวลาทำให้มันเป็นรูปเป็นร่างไม่ได้สักที ปี 2023 แอดพร้อมลุยโปรเจ็คนี้เต็มตัวแล้ว

แอดตั้งใจเขียนหนังสือเล่มนี้เพื่อเป็น guide ให้เพื่อนๆและผู้ที่สนใจอัพสกิล data science มีแหล่งข้อมูลดีๆ high-quality ไว้ใช้ศึกษาด้วยตัวเอง และที่สำคัญที่สุดคือฟรีด้วย เกินปุยมุ้ย

หนังสือ Humble Guide จะมาในรูปแบบ weekly newsletter เปิดให้อ่านฟรีบนเว็บไซต์นี้ เพื่อนๆที่สนใจสามารถกด subscribe เพื่อรับเนื้อหาใหม่ผ่าน email ฟรีทุกสัปดาห์

สิ่งแรกที่อยากบอกทุกคนคือ data science is a skill set ที่เราสามารถเรียนรู้ + ฝึกฝนให้เก่งขึ้นได้ มนุษย์เป็ด generalist อย่างพวกเราเชื่อว่าทุกอย่างเป็นทักษะที่เรียนรู้ได้หมดเลย

ถ้าอยากจะเรียน data science ให้ได้ผลดีที่สุด ต้องเริ่มจากการปรับ mindset ของตัวเองก่อน

The Right Mindset

แล้ววิธีการคิดที่ถูกต้องมันหน้าตาเป็นยังไง? แอดขอตอบคำถามนี้ด้วยงานของ Product Owner

อธิบายสั้นๆ Product Owner (PO) คือตำแหน่งงานในสาย tech ที่กำลังมาแรงในปัจจุบัน มีหน้าที่ดูแลจัดการ products เพื่อตอบโจทย์ความต้องการของลูกค้า

แล้วงาน PO เกี่ยวอะไรกับการเรียน data skills? จะนั่งมอง ยืนมอง มุมไหนก็เกี่ยว

แอดคิดว่าทุกคนมีตำแหน่ง PO ติดตัวอยู่แล้วและ product ที่เรากำลังสร้างขึ้นมาคือชีวิตหรือ career ที่เราอยากเป็น ทุกอย่างที่เราทำ + ทุก skills ที่เราเรียนส่งผลให้เราเป็นเราในเวอร์ชันนี้

You are a product owner. Your life is the product.

It's the sum of everything you do.

สรุปคือ PO กำหนดเป้าหมายให้กับ product เหมือนที่เรากำหนดเป้าหมายให้กับชีวิต เราเรียน skills เพื่อปิด gap ระหว่างสิ่งที่เราเป็นอยู่ vs. สิ่งที่เราอยากเป็น

  • Product มี features ส่วน our life มี skills
  • ชีวิตคือการเลือก the right features to build หรือ the right skills to learn

และเป้าหมายของ Humble Guide คือการช่วยให้ผู้อ่านทุกคนเข้าใกล้การเป็น data analyst ได้เร็วที่สุด (เพราะเรียนอย่างถูกวิธี know what + how to learn) สนุกและเอาไปใช้ได้จริงมากที่สุด

Buddha สอนว่า "The mind is everything. What you think, you become." ถ้าเราเชื่อว่าทำได้ เราก็เป็นสิ่งนั้นได้ วิทยาศาสตร์พิสูจน์แล้วว่าสมองเราคือ prediction machine

คำถามแบบ "เรียนจบไม่ตรงสายจะข้ามสายมา data ได้มั้ย?" ต้องเลิกถามได้แล้ว แอดขอร้อง 555+ แอดก็ข้ามสายจากเศรษฐศาสตร์มา data ทุกคนทำได้แน่นอน Epictetus นักปราชญ์ stoic สอนว่า

"First say to yourself what you would be, and then do what you have to do."

อ่านมาขนาดนี้ทุกคนต้องเชื่อว่าตัวเองทำได้แล้ว ถ้าใครพร้อมก็ลุยต่อได้เลยครับ 😊

One needs to learn a lot

Data science เป็น domain ที่รวมหลายๆความรู้เข้าด้วยกัน ในยุคเริ่มต้นจะมีอยู่ 3 ทักษะคือ hacking skills + math/ stats + domain expertise ตามที่ Drew Conway เสนอไว้ในปี 2010

ทุกวันนี้เราเห็นวิวัฒนาการของ Data Science Venn Diagram และทักษะที่ data analyst คนหนึ่งต้องทำได้มันกว้าง + ลึกขึ้นมากทุกๆวัน เพราะตลาดแข่งขันกันสูงขึ้น ความ peak คือเราไม่ได้แข่งกับแค่มนุษย์ แต่ต้องเจอกับ AI เก่งๆอย่าง ChatGPT หรือ Bard ตัวล่าสุดของ Google

Original Venn Diagram ของ Drew Conway (2010)

Drew Conway เขียนไว้ในบทความว่า "One needs to learn a lot" ถ้าอยากทำงานสาย data/ tech เราจะหยุดเรียนรู้ไม่ได้เลย ตั้งเป้าหมายให้ชัดเจนและลงมือทำ

ประโยคนี้ของ Drew จริงๆมีอีกหนึ่ง mindset ซ่อนอยู่ นั่นคือ Perseverance หรือ Grit ความสามารถในการทำงานหนัก มุ่งหน้าสู่เป้าหมายที่วางไว้ ถึงแม้ว่าจะเจออุปสรรคต่างๆ

แอดการันตีเลยว่าการเรียน data science ไม่ง่าย .. แต่เรียนเรื่องนี้ให้สนุก และ painless ที่สุดก็เป็นไปได้เช่นกัน ถ้าเรียนอย่างถูกวิธี ง่ายจนงง ยั๊ง 555+

นอกจาก 3 ทักษะที่เป็นจุดเริ่มต้นของการเรียน data science แอดคิดว่ามีอีกหลายเรื่องที่เราควรรู้ มาดูรายชื่อหนังสือ 8 เล่มที่แอดยกให้เป็นหนังสือที่ดีที่สุดตลอดกาล อ่านจบชีวิตเปลี่ยนทันที

Books I would read

การลงทุนในความรู้แบบที่คุ้มค่าที่สุดคือการซื้อหนังสือ .. มาดอง ยั๊ง ไม่ใช่ๆ 555+ ปกติแอดซื้อ eBooks ใน Kindle Store เพราะมีโปรลดราคาบ่อยๆ อ่านที่ไหนก็ได้ด้วย kindle app

เวลาเลือกซื้อหนังสือ แอดแบ่ง interests ออกเป็นสามกลุ่มคือ science, creativity และ business และหนังสือ 8 เล่มที่แอดบอกต่อทุกคนที่เจอ อยากแนะนำให้อ่านคือ

  1. Think like a freak
  2. Naked statistics
  3. Storytelling with data
  4. Business made simple
  5. Growth hacker marketing
  6. It doesn't have to be crazy at work
  7. Learning how to learn
  8. Building a second brain (more on this later)

แอดอยากให้มีหนังสือพวกนี้ให้อ่านตั้งแต่สมัยเรียน ป.ตรี เลย ถ้าหนังสือดีๆหนึ่งเล่มเปลี่ยนความคิดเราได้ หนังสือดีๆ 8 เล่มก็เปลี่ยนชีวิตเราได้เลย ถ้าได้อ่านตั้งแต่เด็กๆ ป่านนี้ไปไกลแล้ว 555+

ส่วนตัวแอดคิดว่าหนังสือเป็นเครื่องมือที่ช่วยให้เราปิด gap ระหว่างสิ่งที่เราเป็นอยู่ vs. สิ่งที่เราอยากเป็นได้เร็วและคุ้มค่าเวลาที่สุด ปกติแอดอ่านหนังสือ nonfiction เล่มหนึ่งใช้เวลาประมาณ 7-10 วัน

Steve Jobs เคยพูดว่า "Connect the dots looking backwards" เราสามารถเชื่อมโยงความรู้ที่ผ่านมาทั้งหมดของเราเข้าด้วยกัน และการอ่านหนังสือหลายๆด้านคือการเพิ่ม dots ในสมองของเรา ยิ่งเรามี dots เพิ่มขึ้นเท่าไหร่ โอกาสจะเชื่อมโยง dots พวกนั้นก็มากขึ้นเท่านั้น

อีกหนึ่งทักษะที่แอดว่าสำคัญไม่แพ้การอ่าน ก็คือทักษะการเขียน

Dan Koe Tweet (Link)

Dan Koe บอกว่าการอ่านที่ไม่เขียนสรุปเลย ก็เหมือนกับกินอาหารอย่างเดียวแต่ไม่ออกกำลังกาย ถ้าไม่เขียนก็การันตีว่าลืมแน่นอน 555+ writing คือ essential skill ที่ทุกคนควรมีติดตัว

เวลาแอดคิดงานไม่ออก จะหยิบหนังสือมาอ่านหาไอเดียใหม่ๆ และปรับแต่งไอเดียให้เป็นรูปร่าง articulate ผ่านการเขียนบทความ ถ้าไอเดียมันเคลียร์แล้วก็ให้ลงมือทำ build things

ส่วนค่ายหนังสือ nonfiction ที่แอดชอบที่สุดคือ Penguin Books กับสโลแกน Reading Matters เคยนั่งนับหนังสือที่บ้านคร่าวๆเป็นของ penguin ไปแล้วมากกว่าครึ่งหนึ่ง อ่านไม่จบเลย 555+

Things I would learn

ถ้าต้องเริ่มเรียน data science skills ใหม่ตั้งแต่แรก แอดจะแบ่งเนื้อหาที่ต้องเรียนเป็น 3 sprints แต่ละ sprint ใช้เวลาเรียน 2-3 เดือน เรียนจบสามารถเริ่มทำงานในตำแหน่ง data analyst ได้

แต่ละ sprint เรากำหนดความรู้ขั้นต่ำที่สุดที่เราควรรู้ Minimum Viable Knowledge ให้เราสามารถใช้งานเครื่องมือพื้นฐานวิเคราะห์ข้อมูลได้เร็วที่สุด

💡
เรื่องสำคัญที่สุดในการเรียนคือไม่ควรเรียนข้าม sprint ลำดับการเรียนเป็นเรื่องสำคัญมากๆ เราเรียกหลักการนี้ว่า Learning Sprint (Agile)
Data Analyst เป็นอาชีพที่มีการค้นหาเยอะที่สุดใน Google Trends ในช่วง 5 ปีที่ผ่านมา
Data Analyst เป็นอาชีพที่มีการค้นหาเยอะที่สุดใน Google Trends ในช่วง 5 ปีที่ผ่านมา 

แล้วเราจะรู้ได้ไงว่าขั้นต่ำต้องขนาดไหน รู้อะไรบ้าง?

ปกติเราหาข้อมูลพวกนี้ด้วยการทำ online research หรือเข้าไปอยู่ใน communities เพื่อพูดคุยกับคนที่ทำงานในสายงานนี้แล้ว หรือง่ายสุดแค่ติดตามอ่าน Humble Guide นี้ เดี๋ยวรู้เลย 555+

1st Sprint

Sprint แรกเรียนพื้นฐานการใช้งาน spreadsheets และ SQL ส่วนตัวแอดเชียร์ให้เริ่มจาก Google Sheets มากกว่า Excel เพราะใช้งานฟรีผ่านเว็บได้เลย

  • Spreadsheets
  • SQL Database
  • Basic statistics (+ visualization)
  • Basic business knowledge

ในแต่ละ sprint จะมีเนื้อหาที่เป็น tool + theory ผสมกัน หลายคนเรียนแต่ Sheets อย่างเดียว แต่ไม่แตะเรื่องสถิติเลย ทั้งที่จริงๆมันเรียนพร้อมกันได้ เช่น การวิเคราะห์ผลสถิติด้วย Google Sheets

2nd Sprint

Sprint ที่สองเริ่มเรียน programming เลือกภาษาแรกระหว่าง R หรือ Python ในหัวข้อต่อไปแอดเขียน discuss ว่าเราควรจะเลือกเรียนภาษาไหนเป็นภาษาแรก (ความเห็นส่วนตัวนะ 555+)

อีกสามทักษะใน sprint นี้มีการจัดการข้อมูล ให้โฟกัสที่ structured data ก่อน หน้าตาเหมือนข้อมูลที่เราทำบน Sheets และ Database เรียนการสร้าง dashboard และความน่าจะเป็นพื้นฐาน

  • Programming (first language)
  • Data transformation/ wrangling
  • Looker studio dashboard
  • Basic probability (high school refresher)

3rd Sprint

Sprint ที่สามให้เลือกเรียนภาษาที่สอง ถ้าภาษาแรกเป็น R ภาษาที่สองก็เป็น Python หรือ vice versa เรียนทักษะการสื่อสาร storytelling ทั้งการพูดและเขียน report/ presentation

แอดเก็บ machine learning ไว้ใน sprint สุดท้ายเลย จริงๆตำแหน่ง data analyst แค่รู้พื้นฐานการทำพวก train test split, cross validation, model selection และ model evaluation รู้วิธีการจัดการกับปัญหา overfitting ก็น่าจะเพียงพอกับการสมัครงานแล้วครับ

  • Programming (second language)
  • Communication skills
  • Basic classical machine learning
  • Optional - Basic cloud concepts
  • Optional - Learn more dashboard tools: Power BI vs. Tableau

ถ้ามีเวลาแอดอยากเชียร์ให้เรียนพื้นฐาน cloud เพิ่มนิดหน่อย ตอนนี้เราใช้ cloud-based services กันทุกวันทั้งในชีวิตส่วนตัวและการทำงาน และปิดท้าย sprint นี้ด้วยการเลือกเรียน dashboard tools อีกสักตัวหนึ่งระหว่าง Power BI และ Tableau

ยิ่งเราทำได้หลายอย่าง โอกาสในการหางานก็จะเปิดกว้างขึ้น

สำหรับรายละเอียดแบบเต็มๆว่าต้องเรียนอะไร topics ไหนบ้างในแต่ละหัวข้อ รอติดตามได้ใน newsletter ฉบับต่อๆไปของซีรีส์ A Humble Guide to Data Science นะครับ 😊

First language I would learn

10 ปีก่อนแอดเริ่มเขียน R เป็นภาษาแรกบน DataCamp

ถ้าวันนี้ให้เลือกเรียนภาษาแรกระหว่าง R vs. Python แอดก็เลือก R อยู่ดี โดยเฉพาะถ้าเป้าหมายของเราคือการเป็น data analyst ทำงานกับ data frame/ database เป็นหลัก

💡
DataCamp เปิดสอนครั้งแรกในปี 2013 โดยคอร์สแรกๆที่ขึ้นบน platform จะเน้นที่ R เป็นหลักเลย เค้าเพิ่งมาเติมหลักสูตร Python และภาษาอื่นๆในช่วงหลัง

R เป็นภาษาที่พัฒนาโดยนักสถิติ Ross Ihaka และ Robert Gentleman ที่ประเทศนิวซีแลนด์เปิดตัวเวอร์ชันแรกในปี 1993 หลายคนเรียก R ว่า fast data crunching language

จุดเด่นของ R คือเกิดมาก็ทำงานกับ data frame ได้เลย (native)

จะต่างกับ Python ที่เป็น general-purpose language พัฒนาโดย Guido van Rossum นักวิทยาศาสตร์ข้อมูลชาวดัตช์ เปิดตัวก่อน R สองปี แต่แนวคิด paradigm ของสองภาษาต่างกันมาก

คำตอบแอดเป็น personal preference และประสบการณ์ตรงที่เรียนมาทั้งสองภาษา แต่แอดการันตีว่าสองชั่วโมงที่เรียน R ได้ผลลัพธ์มากกว่าสองชั่วโมงที่เรียน Python แน่นอน

สรุปถ้าอยากทำ data เป็นไวๆ เลือกเรียนภาษาแรกเป็น R ภาษาที่สองเป็น Python เรียนภาษาแรกให้คล่อง แล้วภาษาต่อๆไปจะง่ายขึ้นเยอะ เพราะ core concepts เหมือนเดิม ต่างกันแค่ syntax

Tips to learn SQL

SQL คือ domain-specific languages (DSLs) ที่ใช้ทำงานกับ databases

เวลาเราเขียน SQL จะเป็นแบบ declarative คือเขียนสิ่งที่เราต้องการ declare what we want โดยไม่ต้องสนใจ how หรือ what's behind the scene

ตัวอย่างเช่น ทีม marketing ส่ง business request ว่าอยากได้รายชื่อลูกค้าที่มีค่าใช้จ่ายมากกว่า 1000 บาทต่อเดือนไปทำแคมเปญ ทีม analyst จะเปลี่ยน request → SQL query แบบนี้

// marketing request
Select every customers who has spending more than 1000 THB per month.

// analyst query
SELECT firstname, lastname FROM customers
WHERE monthly_spending > 1000;

รัน query เสร็จแล้วก็ export csv ส่งให้ทีม marketing ได้เลยง่ายๆ

แอดยกให้ SQL เป็นภาษาแรกที่ data analyst ต้องเขียนให้เป็นก่อนเลย logic ก็ง่ายๆเพราะทุกบริษัทมีการเก็บข้อมูลใน database แปลว่าถ้าเราเขียน SQL ได้ ก็สมัครงานได้เกือบทุกที่แล้ว

คำแนะนำสำหรับเพื่อนๆที่เพิ่งเรียน SQL ครั้งแรก จะมีอยู่ 2 clauses ที่เราต้องใช้ให้คล่อง 90% ของการเขียน SQL queries ของาน data analyst จะมีสองคำนี้อยู่เสมอ

  • SELECT ดึงคอลัมน์จาก table
  • WHERE ฟิลเตอร์ table ด้วยเงื่อนไข

SQL queries ที่ data analyst ใช้จะเริ่มจากการเขียน SELECT ตามด้วยชื่อคอลัมน์ที่เราต้องการ FROM table นั้นๆ ตัวอย่างเช่นการดึงข้อมูลลูกค้าจากตาราง customers

SELECT 
  firstname,
  lastname,
  country,
  phone,
  email
FROM customers;

ถ้าเราต้องการดึงข้อมูลลูกค้าที่อยู่ในประเทศอเมริกา แค่เขียน WHERE ตามด้วยเงื่อนไขแบบนี้

SELECT * FROM customers
WHERE country = 'United States';

แค่ใช้ SELECT + WHERE เป็น เราก็เริ่มดึงข้อมูลจาก databases ได้แล้ว ตัวอย่างของ minimum viable knowledge ในการทำงานจริง

How to remember everything?

จากประสบการณ์แอดบอกได้เลยว่า "เรียนแล้วลืม" คือปัญหาใหญ่สุดของการเรียนหนังสือ 555+

ปีที่แล้วแอดอ่านหนังสือ Building a Second Brain ของ Tiago Forte เป็นหนังสือที่เปลี่ยนมุมมองและวิธีการคิดเรื่อง note-taking อย่างสิ้นเชิง ไอเดียหลักๆของ second brain คือ

  • ไม่จดก็ลืมแน่นอน สมองเก่งเรื่องสร้างไอเดียใหม่ๆ แต่มันจำอะไรไม่ค่อยเก่งเท่าไหร่
  • ทุก notes ที่เราจดคือ knowledge หรือ building blocks ที่เรานำไปต่อยอดได้
  • Mindset เราต้องเปลี่ยนจาก consumers เป็น creators of information

เรามอง second brain เป็น production system ที่เปลี่ยนสิ่งที่เราเรียนรู้ input ให้กลายเป็นผลงานสักอย่างหนึ่ง output และทั้งหมดเริ่มต้นได้ง่ายๆจากการจดโน้ต (note-taking)

Building A Second Brain

Note-taking is a production system that transforms input into output.

ตอนนี้แอดใช้ Notion จดโน้ตทุกอย่างเลย แม้แต่ไอเดียของหนังสือ A Humble Guide ก็อยู่ใน Notion ทั้งหมดเลย ประเด็นคือไอเดียของเราต้องมีที่อยู่ แต่มันอยู่ในสมองหลัก biological brain ของเราไม่ได้ เพราะมันลืมเก่ง 555+ แค่ย้ายไอเดียมาอยู่ใน second brain เราก็จะไม่ลืมอีกต่อไป

จากไอเดียของ Tiago แอดค้นพบว่าวิธีการเรียนแบบที่ได้ผลดีที่สุดมีแค่ 3 ขั้นตอนง่ายๆ

  1. เรียนรู้ (จากหนังสือ บทความ คอร์ส วีดีโอ YouTube ได้หมดเลย)
  2. จดโน้ต ทำสรุปเป็นภาษาตัวเองใน second brain
  3. แชร์สิ่งที่เราเรียนมา

เราเปลี่ยน input ในขั้นตอนแรกเป็น output ในขั้นตอนสุดท้าย ง่ายจนงง แค่นี้จริงๆ 555+

หลายคนคิดว่า portfolio ของคนทำงานสาย data ต้องมาในรูปแบบ code-based เท่านั้น แต่จริงๆมันจะเป็นอะไรก็ได้ เช่น การเขียน blogs แชร์ความรู้ หรือแค่ social media posts ส่วนตัวก็ได้ ถ้าสิ่งที่เราเขียนมีประโยชน์กับคนที่ติดตามเรา why not sharing? 😊

Second brain เป็นอีกหนึ่งเหตุผลที่แอดคิดว่า writing skill เป็นทักษะที่สำคัญมากแบบ ก. ล้านตัวในยุคนี้ เราจะไปสู่ขั้นตอนที่สามไม่ได้เลย ถ้าเราเขียนสิ่งที่อยู่ในหัวเราออกมาเป็นคำพูดไม่ได้

How long do I need to learn?

การเรียน data science เป็น lifelong journey ต้องเรียนนานเท่าไหร่ถึงจะทำได้ เป็นคำถามที่ตอบยากมาก เราอาจจะต้องใช้เวลาทั้งชีวิตเพื่อเรียนรู้สิ่งนี้ ความรู้เก่าหมดอายุ ความรู้ใหม่เกิดขึ้นมาเรื่อยๆ

Ken Jee, YouTube creator ด้าน data science เสนอไอเดียว่าแทนที่จะถามว่าใช้เวลาเท่าไหร่ เราเปลี่ยนมาใช้ concept เรื่อง goals ดีกว่า ให้ตั้งเป้าหมายว่าเราอยากทำอะไร แล้วเรียนทักษะที่ช่วยให้เราไปถึงเป้าหมายนั้นได้เร็วที่สุด

Create your own roadmap, define your goals.

เช่น ถ้า goal ในอีก 1 เดือนข้างหน้าคืออยากสร้าง Looker Studio Dashboard ไว้แชร์ข้อมูลกับทีมของเรา ก็ต้องเรียนพื้นฐานต่อไปนี้ ถึงจะสามารถสร้าง dashboard เวอร์ชันแรกได้

  • Structured dataset
  • Data types
  • Dimension vs. Measurement
  • Basic charts/ visuals
  • Dashboard composition

ใช้ goals เป็นตัวกำหนด skill sets ที่เราต้องเรียน แต่ถ้าใครยังอยากได้คำตอบจริงๆว่าเรียนนานแค่ไหนถึงจะเริ่มทำงานระดับ junior level ได้? แอดก็มีคำตอบให้ 555+

Data Science Bootcamp ที่แอดเปิดสอนมาตั้งแต่ ต.ค. 2020 เน้นพื้นฐานการทำงานกับ data เรียนการใช้เครื่องมือสำคัญๆและ basic concepts ด้านสถิติ รุ่นหนึ่งเรียนกัน 4-6 เดือน นักเรียนได้งานไปแล้วมากกว่า 100 คน ประมาณ 80% ของนักเรียนในแคมป์เรียนจบไม่ตรงสายเลยด้วย

Consistency is key ความต่อเนื่องและชั่วโมงเรียนในแต่ละสัปดาห์สำคัญที่สุด ส่วนตัวแอดแนะนำแบ่งเวลาเรียนวันละ 1-2 ชั่วโมง เรียนต่อเนื่องซักสองเดือนก็เริ่มเห็นผล จะรู้สึกว่าตัวเราเก่งขึ้นเลย

💡
ถ้าใครอยากเริ่มหางาน ควรฝึกฝน 5 skills นี้ให้แน่นๆก่อน spreadsheets, SQL, R, basic stats และ dashboard พวกนี้คือ minimum requirements เวลาสมัครงานตำแหน่ง data analyst เลย

เรียน + จดโน้ต ทำสรุปของตัวเอง + สร้าง portfolio ให้เวลากับแค่สามอย่างนี้ ก็เข้าใกล้ทุก career ที่เราอยากเป็นได้แล้ว ไม่ได้จำกัดเฉพาะตำแหน่ง data analyst เท่านั้น

So many platforms

Online platforms สำหรับเรียน data science มีให้เลือกเยอะมาก แต่ละที่จะมีสไตล์การสอนแตกต่างกันไป บางอันเป็น text-based บางอันเป็น video-based

รายชื่อ platforms ที่แอดแนะนำไม่มีของไทยเลย 555+ (ถือว่าฝึกภาษาอังกฤษไปในตัว) เนื้อหาระดับ world class มีทั้งแบบเรียนฟรีหรือจะอัพเกรดเพื่อรับใบ certificates ก็ได้

  • Coursera โรงเรียนออนไลน์แห่งแรกของโลก มีผู้เรียนมากกว่า 113 ล้านคนในปี 2022
  • DataCamp แอดมีวันนี้เพราะ datacamp ให้ 555+ เรียนมาหลายปีจนตอนนี้จะครบ 800K XP แล้ว เขียน R เป็นเพราะเรียนที่นี่เลย (link to profile)
  • Codecademy เริ่มจากสอนด้าน software development และต่อยอดมาสาย data science แบบจัดเต็ม มี career path ให้เลือกหลายแบบ
  • Udemy ตำนานการดองคอร์สเริ่มที่นี่ 555+ อยากได้คอร์สเรียนราคาประหยัด คุณภาพดีมาก ลองดูคอร์สของ Jose Portilla (3.2m) , Kirill Eremenko (2.3m) , Colt Steele (1.4m)
  • LinkedIn Learning เป็นบริษัทในเครือของ Microsoft เน้นคอร์สเรียนสำหรับ professionals เป็นหลัก เนื้อหามีความหลากหลายทั้งด้าน business + tech
  • Educative ช่วงนี้กำลังมาแรงเลยเป็นคู่แข่งโดยตรงกับ codecademy
  • AWS Skill Builder/ Microsoft Learn อัพสกิลความรู้ cloud ได้ฟรีๆกับสอง cloud providers อันดับ 1, 2 ของโลก

ถ้าให้แอดเลือก top 3 platforms ที่คุ้มค่าที่จะลงทุนคือ Coursera Plus, DataCamp และ Codecademy ได้เรียนทั้ง data science, business & marketing และ coding

Full-Stack Software Engineer Career Path บน codecademy

ส่วนตัวแอดคิดว่า Coursera Plus ใช้เรียนแทนปริญญาโทได้เลย ถ้าค่าใช้จ่ายตลอดหลักสูตรของ ป.โทอยู่ที่ 250K บาท เงินก้อนนี้เอามาเรียน 7,000+ คอร์สบน Coursera ได้เกือบๆ 10 ปี

ในทางเศรษฐศาสตร์เราเรียก concept นี้ว่า trade-off

Meta, Google, AWS, Microsoft, IBM และบริษัทใหญ่ๆเอาหลักสูตรของตัวเองมาสอนบน Coursera ทำ production ดีมาก เรียนจบสามารถอัพเกรดใบเซอร์ไว้ใช้สมัครงานต่อได้ด้วย

ข้อดีของการเรียนออนไลน์คือจะเข้าเรียนตอนไหนก็ได้แค่มี internet คอร์สมีความหลากหลาย เนื้อหาระดับ world class ยิ่งเรียนมาก ยิ่งทำได้มาก พลังของ self-taught อย่างแท้จริง

หลายๆบริษัทในไทยมี benefits ให้พนักงานเรียนบน platform นี้ฟรีด้วย สมัยแอดทำงาน dtac ก็เข้าเรียน LinkedIn Learning กับ Coursera ประจำ (เค้าบังคับชั่วโมงเรียนด้วย 555+)

Publicly free education

แอดคิดว่าหลายคนน่าจะสังเกตเห็น trend นี้มาสักพักแล้ว

การศึกษาในมหาวิทยาลัยปรับตัวไม่ทันกับการเปลี่ยนแปลงที่เกิดขึ้นในอุตสาหกรรม เราสามารถอัพเดทความรู้ใหม่ๆได้เร็วมากผ่าน YouTube หรือบทความของผู้เชี่ยวชาญบน Medium

ตัวอย่าง YouTube Creators ด้าน data science ที่แอดติดตามอยู่ตอนนี้ เช่น

YouTube Channel ของอาจารย์เอิร์ล Data Professor

อีกช่องทางที่แอดใช้อัพเดทความรู้ใหม่ๆคือ LinkedIn ที่เป็น social network สำหรับคนทำงาน แค่กดติดตาม top creators ในนั้นก็ได้สาระดีๆทุกวัน ตัวอย่างเช่น Andrew Ng, Alex Wang เป็นต้น

นี่คือยุคของ Creator Economy อย่างแท้จริง หลายๆอย่างสามารถเรียนได้ฟรีออนไลน์ หรือจะลงเรียนคอร์สสั้นๆเพื่ออัพสกิลไว้ใช้ทำงานก็ได้ กระเป๋าตังไม่แตกแบบลงเรียนมหาวิทยาลัย

What's next?

แอดลองถาม ChatGPT ด้วยว่าเรียน data science ให้ได้ผลดีที่สุดสำหรับ beginners ควรเริ่มยังไง? และนี่คือคำตอบที่ได้จาก ChatGPT collective intelligence ในโลกอินเตอร์เน็ต

ที่มา ChatGPT

ข้อ 3+4 สามารถรวมเข้าด้วยกัน กลายเป็น 6 steps แบบนี้

  1. Choose your focus
  2. Get familiar with the basics
  3. Start coding + Learn a programming language
  4. Work with real-world data
  5. Read and learn from others
  6. Practice, practice, practice

เหมือนที่ Drew Conway เคยเขียนไว้ "One needs to learn a lot" การเรียน data science เป็น long-term journey และต้องใช้ความพยายามอย่างมาก persistent + dedication

เลยถามต่อว่าหนังสือสำหรับผู้เริ่มต้น มีแนะนำเล่มไหนมั้ย?

ChatGPT แนะนำหนังสือมา 6 เล่มเป็น Python ไปแล้ว 4 เล่ม (1,2,4,5) มี R แค่เล่มเดียว (3) หนังสือในตำนาน สามารถดาวน์โหลดมาอ่านได้ฟรีที่ An Introduction to Statistical Learning ส่วนเล่มที่ 6 สอนทฤษฎีของสำนักพิมพ์ Wiley

ที่มา ChatGPT

ตอนนี้ ChatGPT เปิดให้สมัครแบบ plus (20 USD/ เดือน) ในไทยแล้วด้วย ส่วนตัวคิดว่าแบบฟรีก็ใช้ได้สบายๆ ตัว plus ยังไม่มีฟีเจอร์อะไรใหม่ แค่เข้าใช้งาน service โดยรวมได้เร็วขึ้น

นี่แค่ newsletter ฉบับแรก เนื้อหาจัดเต็มเกินไปแล้วแอด 555+

ถ้าแอดเริ่มเรียน data science ใหม่ตั้งแต่แรก นี่คือบทความที่ตัวแอดอยากอ่านตั้งแต่วันแรกเลย เป็น guide ให้เราเรียนได้อย่างถูกวิธี สนุก เข้าใจง่าย ใช้งานได้จริง

ฉบับหน้าเนื้อหาเด็ดกว่านี้ แอดจะมาอธิบาย key concepts ที่ควรรู้ในงาน data science ให้อ่านกันเอง เพื่อนๆที่อยากอัพสกิล data science แบบเต็มๆ กดสมัคร newsletter รับฟรี content ใหม่ทุกสัปดาห์ที่ A Humble Guide to Data Science แล้วพบกันใหม่ฉบับหน้านะครับ ❤️

PS. Newsletter เขียนไปเขียนมายาวเฉย 555+

Subscribe to Humble Guide to Data Science

Don’t miss out on the latest issues. Sign up now to get access to the library of members-only issues.
jamie@example.com
Subscribe