Hạng B2
21/10/06
337
28.595
93
Em mua vé ảnh dìa, ko biết ảnh có dìa ko
Mới một buổi xa CNL mà giờ vào lại thấy nhiều bài quá , có nhiều anh em hỏi nhiều câu mà chưa kịp trả lời , xin lỗi trước nha . AE nào muốn thì tự copy & paste rồi pm cho chính mình để cất chứ mình không thể email riêng cho từng người được .

Giờ viết tiếp .


Hiện nay chỉ mới một số trường hàng đầu của Mỹ dạy ngành này và cũng chỉ có mới mấy năm nay thôi như UC Berkeley, Stanford, UCI, Caltech, John Hopskin etc . Một số trường nổi tiếng khác chỉ có certificate program vì họ đang chuẩn bị cho chương trình chính thức . Lý do là họ thiếu giáo sư và chưa thống nhất những môn nào sẽ trang bị cho sinh viên... như John Hopskin dùng R, Harvard dùng python trong khi các công ty y khoa và dược lại dùng SAS...

Các trường có ngành Data Science thì chỉ dạy chương trình Master hoặc PhD. Lý do họ đào tạo ra một người data scientist có thể đảm đương được tất cả công việc mà xã hội đang cần. Ví dụ những công ty y khoa, dược thì cần người data scientist phải biết viết research, viết report, thành thạo presentation, đứng diễn thuyết về những công trình tìm tòi nghiên cứu của công ty và phải đúng tiêu chuẩn để được FDA approve vì họ nghỉ rằng chỉ có trình độ master trở lên mới có đủ những khả năng cần thiết để đảm đương công việc này

Những công ty thương mại, bảo hiểm, finance thì không cần ứng viên cao cấp nên trong phạm vị bài này Tamvo giới thiệu đến các bạn một số lớp mà các bạn hoặc con cái các bạn thích về tin học thì có thể lấy để trong thời gian ngắn khoảng từ 4 đến 6 tháng hoặc 1 năm các bạn có thể tìm việc trong ngành Data Science hiện đang rất hot và thiếu người hiện nay.

Hai lãnh vực chính của data science là Computer Science và statistics. Người data scientist không cần biết nhiều CS và statistics như những kỷ sư công nghệ thông tin hoặc cử nhân toán mà chỉ cần biết một phần nhỏ 2 lãnh vực này thôi.

Ví dụ như về CS, họ chỉ cần coding tí xíu để có thể program cách lấy data, tìm max, min... và sql. Statistic thì biết một ít model như Naive Bayes, Decision Tree... dùng đển train data, test data...

1. Dành cho các bạn chưa hề biết gì thì có thể học chương trình Data Science của trường Johns Hopskin

https://www.coursera.org/specializa...ium=growth&utm_campaign=dss4H&utm_content=img

Chương trình này gồm 9 lớp và miễn phí. Nếu các bạn muốn có Certificate thì đóng cho họ 29 usd /course (giá cũ năm ngoái mình giới thiệu một người bạn học)

Do Johns Hopskin là trường nổi tiếng trong ngành Y khoa nên những lớp data science của họ hướng về y khoa, ô nhiễm môi trường. Ngôn ngữ R được dùng để dạy.

Mỗi lớp 4 tuần, họ dạy rất căn bản từ install R Studio, cách dùng source control như GitHub để upload code lên, lấy code về và share code...

6 lớp đầu tiên đủ cho bạn có thể làm công việc của một data science analyst . Course 7 và 8 thì đi sâu về Statistic và Machine learning các bạn có thể skip nó. Khi đi làm thì các bạn có thể bổ sung những kiến thức này trong công việc

Machine Learning nghe thì ghê gớm nhưng đã có những Libraries và packages như scikit-learn. Các bạn chỉ cần hiểu và sử dụng

2. Các bạn có background về CS hoặc thấy chương trình 1 dễ quá thì có thể học của Harvard

lecture slides
http://cs109.github.io/2014/pages/schedule.html

video + audio
http://cm.dce.harvard.edu/2015/01/14328/publicationListing.shtml

Chương trình này Hardvard dùng python và cũng hơi cao. Ngay lab đầu tiên đã có bài khó đó là viết chương trình mô phỏng Game show nổi tiếng Monty Hall và phản bác lại kết luận của những nhà toán học trước đây về cách chơi

Nếu bạn chọn học chương trình của Hardvard thì chọn lecture và video của lớp 2013, do 2 ông thầy dạy. Hai ông đó dạy hay hơn những lớp sau này do người khác dạy

Tương tự Berkeley cũng có chương trình giống như vậy . Link của Berkeley không public công khai nên các bạn nào muốn thì phải chịu khó tìm nhờ Mr. Goo .

Chương Trình Data Science của trường kỹ thuật hàng đầu thế giới CalTech

https://www.coursera.org/course/bigdataschool

Lưu ý các bạn những chương trình trong mục 2 này chỉ thích hợp cho những người có background CS/ Statistic hoặc có trình độ sau đai học vì số lượng bài nhiều, mức độ khó và phức tạp cao và đòi hỏi kiến thức rộng ở nhiều lãnh vực khác

3. Với các bạn nước ta mà có gặp trở ngại về English, các bạn vẫn học được qua những bài dạy về Data analysis bằng tiếng Việt của bác sĩ Nguyễn văn Tuấn

https://tuanvanle.wordpress.com/201...rong-phan-tich-du-lieu-kh-gs-nguyen-van-tuan/

http://www.ykhoa.net/baigiang/muasach.htm

Vì là bác sĩ nên bài học và ví dụ quay quanh y khoa như tuổi thọ, nhồi máu cơ tim, kích thước bộ phận sinh dục....

4. Với các bạn đã làm hoặc đang xử dụng data analysis, muốn tìm hiểu Machine Learning thì lấy lớp này

https://www.udacity.com/course/ud120

Trong đây có 1 project hay là dựa vào hệ thống email, người ta tiếp tục truy tìm những người khác có liên quan mà chưa bị truy tố trong vụ án Enron

5. Với các bạn đã có kinh nghiệm, muốn chỉ học vài buổi để có certificate trong CV/resume hoặc chỉ muốn tìm hiểu những cái mới như Hadoop, mongoDB, nosql, jaql, hive, pig... các bạn theo link này

http://bigdatauniversity.com/

Hy vọng Tamvo cung cấp cho các bạn một ít thông tin bổ ích về lãnh vực mới này. Hy vọng thế hệ con cháu chúng ta sẽ giúp nước ta đứng đầu trong lãnh vực "hot" data science này :) .
 
Hạng D
26/10/10
1.676
14.499
113
Mới một buổi xa CNL mà giờ vào lại thấy nhiều bài quá , có nhiều anh em hỏi nhiều câu mà chưa kịp trả lời , xin lỗi trước nha . AE nào muốn thì tự copy & paste rồi pm cho chính mình để cất chứ mình không thể email riêng cho từng người được .

Giờ viết tiếp .


Hiện nay chỉ mới một số trường hàng đầu của Mỹ dạy ngành này và cũng chỉ có mới mấy năm nay thôi như UC Berkeley, Stanford, UCI, Caltech, John Hopskin etc . Một số trường nổi tiếng khác chỉ có certificate program vì họ đang chuẩn bị cho chương trình chính thức . Lý do là họ thiếu giáo sư và chưa thống nhất những môn nào sẽ trang bị cho sinh viên... như John Hopskin dùng R, Harvard dùng python trong khi các công ty y khoa và dược lại dùng SAS...

Các trường có ngành Data Science thì chỉ dạy chương trình Master hoặc PhD. Lý do họ đào tạo ra một người data scientist có thể đảm đương được tất cả công việc mà xã hội đang cần. Ví dụ những công ty y khoa, dược thì cần người data scientist phải biết viết research, viết report, thành thạo presentation, đứng diễn thuyết về những công trình tìm tòi nghiên cứu của công ty và phải đúng tiêu chuẩn để được FDA approve vì họ nghỉ rằng chỉ có trình độ master trở lên mới có đủ những khả năng cần thiết để đảm đương công việc này

Những công ty thương mại, bảo hiểm, finance thì không cần ứng viên cao cấp nên trong phạm vị bài này Tamvo giới thiệu đến các bạn một số lớp mà các bạn hoặc con cái các bạn thích về tin học thì có thể lấy để trong thời gian ngắn khoảng từ 4 đến 6 tháng hoặc 1 năm các bạn có thể tìm việc trong ngành Data Science hiện đang rất hot và thiếu người hiện nay.

Hai lãnh vực chính của data science là Computer Science và statistics. Người data scientist không cần biết nhiều CS và statistics như những kỷ sư công nghệ thông tin hoặc cử nhân toán mà chỉ cần biết một phần nhỏ 2 lãnh vực này thôi.

Ví dụ như về CS, họ chỉ cần coding tí xíu để có thể program cách lấy data, tìm max, min... và sql. Statistic thì biết một ít model như Naive Bayes, Decision Tree... dùng đển train data, test data...

1. Dành cho các bạn chưa hề biết gì thì có thể học chương trình Data Science của trường Johns Hopskin

https://www.coursera.org/specializa...ium=growth&utm_campaign=dss4H&utm_content=img

Chương trình này gồm 9 lớp và miễn phí. Nếu các bạn muốn có Certificate thì đóng cho họ 29 usd /course (giá cũ năm ngoái mình giới thiệu một người bạn học)

Do Johns Hopskin là trường nổi tiếng trong ngành Y khoa nên những lớp data science của họ hướng về y khoa, ô nhiễm môi trường. Ngôn ngữ R được dùng để dạy.

Mỗi lớp 4 tuần, họ dạy rất căn bản từ install R Studio, cách dùng source control như GitHub để upload code lên, lấy code về và share code...

6 lớp đầu tiên đủ cho bạn có thể làm công việc của một data science analyst . Course 7 và 8 thì đi sâu về Statistic và Machine learning các bạn có thể skip nó. Khi đi làm thì các bạn có thể bổ sung những kiến thức này trong công việc

Machine Learning nghe thì ghê gớm nhưng đã có những Libraries và packages như scikit-learn. Các bạn chỉ cần hiểu và sử dụng

2. Các bạn có background về CS hoặc thấy chương trình 1 dễ quá thì có thể học của Harvard

lecture slides
http://cs109.github.io/2014/pages/schedule.html

video + audio
http://cm.dce.harvard.edu/2015/01/14328/publicationListing.shtml

Chương trình này Hardvard dùng python và cũng hơi cao. Ngay lab đầu tiên đã có bài khó đó là viết chương trình mô phỏng Game show nổi tiếng Monty Hall và phản bác lại kết luận của những nhà toán học trước đây về cách chơi

Nếu bạn chọn học chương trình của Hardvard thì chọn lecture và video của lớp 2013, do 2 ông thầy dạy. Hai ông đó dạy hay hơn những lớp sau này do người khác dạy

Tương tự Berkeley cũng có chương trình giống như vậy . Link của Berkeley không public công khai nên các bạn nào muốn thì phải chịu khó tìm nhờ Mr. Goo .

Chương Trình Data Science của trường kỹ thuật hàng đầu thế giới CalTech

https://www.coursera.org/course/bigdataschool

Lưu ý các bạn những chương trình trong mục 2 này chỉ thích hợp cho những người có background CS/ Statistic hoặc có trình độ sau đai học vì số lượng bài nhiều, mức độ khó và phức tạp cao và đòi hỏi kiến thức rộng ở nhiều lãnh vực khác

3. Với các bạn nước ta mà có gặp trở ngại về English, các bạn vẫn học được qua những bài dạy về Data analysis bằng tiếng Việt của bác sĩ Nguyễn văn Tuấn

https://tuanvanle.wordpress.com/201...rong-phan-tich-du-lieu-kh-gs-nguyen-van-tuan/

http://www.ykhoa.net/baigiang/muasach.htm

Vì là bác sĩ nên bài học và ví dụ quay quanh y khoa như tuổi thọ, nhồi máu cơ tim, kích thước bộ phận sinh dục....

4. Với các bạn đã làm hoặc đang xử dụng data analysis, muốn tìm hiểu Machine Learning thì lấy lớp này

https://www.udacity.com/course/ud120

Trong đây có 1 project hay là dựa vào hệ thống email, người ta tiếp tục truy tìm những người khác có liên quan mà chưa bị truy tố trong vụ án Enron

5. Với các bạn đã có kinh nghiệm, muốn chỉ học vài buổi để có certificate trong CV/resume hoặc chỉ muốn tìm hiểu những cái mới như Hadoop, mongoDB, nosql, jaql, hive, pig... các bạn theo link này

http://bigdatauniversity.com/

Hy vọng Tamvo cung cấp cho các bạn một ít thông tin bổ ích về lãnh vực mới này. Biết đâu được thế hệ con cháu chúng ta sẽ giúp nước ta đứng đầu trong lãnh vực "hot" data science này :) .​
 
Hạng D
26/10/10
1.676
14.499
113
Hôm qua có một số ace pm hỏi , mình xin trả lời chung là :

Các bạn có con nhỏ trong lứa tuổi highschool có niềm đam mê tin học , hoặc các bạn muốn hướng dẫn con em từng bước đi vào lãnh vực này... theo ý kiến cá nhân và kinh nghiệm của bản thân, các bạn nên tập trung cho các em học giỏi môn toán vì đó là nên tảng của những môn khoa học khác. Môn toán tập cho các em cách suy nghĩ logic đúng, sai... từ đó suy luận và tìm ra câu trả lời những vấn đề khác...

Nếu muốn từ từ làm quen với coding, mình thấy có lớp online này dạy python thích hợp:

https://www.udacity.com/course/ud036

Ngôn ngữ python không quá phức tạp như những ngôn ngữ khác như C++, Java. Cấu trúc lệnh trong sáng và cũng không cần khai báo data type nên dễ hiểu cho người mới bắt đầu học. Một số trường thuộc hệ thống UC ở California bắt đầu giảng dạy python thay thế java .

Hoặc bạn có thể xem những lớp như sql, html ở đây mà mình nghĩ cũng rất đơn giản phù hợp với lứa tuổi trung học :

http://www.w3schools.com/

Mấy lớp đầu về R của Johns Hopskin mà Tamvo post trong trước, dành cho người chưa biết gì về data science, các em tuổi trung học nước ta đủ khả năng học được . Mấy lớp này học không tốn tiền. Bạn chỉ phải trả tiền khi muốn có certificate hoặc muốn làm project cuối.
 
Hạng D
24/11/06
3.928
20.100
113
Vietnam
Hôm qua có một số ace pm hỏi , mình xin trả lời chung là :

Các bạn có con nhỏ trong lứa tuổi highschool có niềm đam mê tin học , hoặc các bạn muốn hướng dẫn con em từng bước đi vào lãnh vực này... theo ý kiến cá nhân và kinh nghiệm của bản thân, các bạn nên tập trung cho các em học giỏi môn toán vì đó là nên tảng của những môn khoa học khác. Môn toán tập cho các em cách suy nghĩ logic đúng, sai... từ đó suy luận và tìm ra câu trả lời những vấn đề khác...

Nếu muốn từ từ làm quen với coding, mình thấy có lớp online này dạy python thích hợp:

https://www.udacity.com/course/ud036

Ngôn ngữ python không quá phức tạp như những ngôn ngữ khác như C++, Java. Cấu trúc lệnh trong sáng và cũng không cần khai báo data type nên dễ hiểu cho người mới bắt đầu học. Một số trường thuộc hệ thống UC ở California bắt đầu giảng dạy python thay thế java .

Hoặc bạn có thể xem những lớp như sql, html ở đây mà mình nghĩ cũng rất đơn giản phù hợp với lứa tuổi trung học :

http://www.w3schools.com/

Mấy lớp đầu về R của Johns Hopskin mà Tamvo post trong trước, dành cho người chưa biết gì về data science, các em tuổi trung học nước ta đủ khả năng học được . Mấy lớp này học không tốn tiền. Bạn chỉ phải trả tiền khi muốn có certificate hoặc muốn làm project cuối.

Việt kiều có học công nhận có khác . Kinh thật