Hạng D
26/10/10
1.676
14.509
113
Em thấy bác @tamvo nói rất đúng nhưng không đầy đủ, vì như project bác mô tả chỉ cần engineer là đủ làm rồi, học thêm các lớp chuyên sâu và các công cụ và nền tảng là đủ. Chả cần học tới PhD.

Mình không viết câu nào bảo là học Data Science thì cần phải học đến PhD nhé . Bác làm ơn đọc lại . Ngành này hái ra rất nhiều tiền mà con cháu chúng ta chỉ cần tốn 4 năm (để lấy Bachelor) . Vì là ngành mới lại là rất "high demand" nên lấy xong bằng 4 năm thì hầu hết có việc liền với mức lương khởi đầu cũng cở 100K/năm chưa kể stock options . Kiến thức cơ bản sau khi học 4 năm về Data Science rồi ra làm vài năm va chạm thực tế thì trình còn cao hơn mấy tay cứ bám theo học PhD về ngành này nữa đó . Chứ tính cho con cháu học lấy cho bằng được PhD thì chắc hết tiền mà chưa chắc con mình lấy được bằng PhD vì để pass qualifying exam đã khó, tìm ra được thesis mới lại khó hơn, bảo vê được thesis lại càng khó . Nói chung, không nên khuyến khích con cái mình theo học PhD ngay sau khi lấy xong BA/BS mà phải ra làm việc, và khi làm việc cho hãng thì hãng sẽ đài thọ mình lấy bằng cao hơn mà mình chả tốn thêm xu nào cho tiền học phí .
 
Hạng D
4/5/12
4.401
26.585
175
Mình không viết câu nào bảo là học Data Science thì cần phải học đến PhD nhé . Bác làm ơn đọc lại . Ngành này hái ra rất nhiều tiền mà con cháu chúng ta chỉ cần tốn 4 năm (để lấy Bachelor) . Vì là ngành mới lại là rất "high demand" nên lấy xong bằng 4 năm thì hầu hết có việc liền với mức lương khởi đầu cũng cở 100K/năm chưa kể stock options . Kiến thức cơ bản sau khi học 4 năm về Data Science rồi ra làm vài năm va chạm thực tế thì trình còn cao hơn mấy tay cứ bám theo học PhD về ngành này nữa đó . Chứ tính cho con cháu học lấy cho bằng được PhD thì chắc hết tiền mà chưa chắc con mình lấy được bằng PhD vì để pass qualifying exam đã khó, tìm ra được thesis mới lại khó hơn, bảo vê được thesis lại càng khó . Nói chung, không nên khuyến khích con cái mình theo học PhD ngay sau khi lấy xong BA/BS mà phải ra làm việc, và khi làm việc cho hãng thì hãng sẽ đài thọ mình lấy bằng cao hơn mà mình chả tốn thêm xu nào cho tiền học phí .
Tại lúc đầu nghe ông ngr040 bảo vậy, tưởng ý anh là đẩy con cháu lên học cao luôn. Trời ạ, học cao xong cái gì cũng nói lên cao hết. Chứ tới bachelor là ngồi đếm tiền mỏi tay rồi.
 
Hạng D
26/10/10
1.676
14.509
113
8 năng khiếu cần thiết để trở thành data scientist hay data science engineer :

(Nếu không hiểu nổi tiếng Anh thì nhờ Mr. Goo nha anh em)

Basic Tools: No matter what type of company you’re interviewing for, you’re likely going to be expected to know how to use the tools of the trade. This means a statistical programming language, like R or Python, and a database querying language like SQL.

Basic Statistics: At least a basic understanding of statistics is vital as a data scientist. An interviewer once told me that many of the people he interviewed couldn’t even provide the correct definition of a p-value. You should be familiar with statistical tests, distributions, maximum likelihood estimators, etc. Think back to your basic stats class! This will also be the case for machine learning, but one of the more important aspects of your statistics knowledge will be understanding when different techniques are (or aren’t) a valid approach. Statistics is important at all company types, but especially data-driven companies where the product is not data-focused and product stakeholders will depend on your help to make decisions and design / evaluate experiments.

Machine Learning: If you’re at a large company with huge amounts of data, or working at a company where the product itself is especially data-driven, it may be the case that you’ll want to be familiar with machine learning methods. This can mean things like k-nearest neighbors, random forests, ensemble methods – all of the machine learning buzzwords. It’s true that a lot of these techniques can be implemented using R or Python libraries – because of this, it’s not necessarily a dealbreaker if you’re not the world’s leading expert on how the algorithms work. More important is to understand the broadstrokes and really understand when it is appropriate to use different techniques.

Multivariable Calculus and Linear Algebra: You may in fact be asked to derive some of the machine learning or statistics results you employ elsewhere in your interview. Even if you’re not, your interviewer may ask you some basic multivariable calculus or linear algebra questions, since they form the basis of a lot of these techniques. You may wonder why a data scientist would need to understand this stuff if there are a bunch of out of the box implementations in sklearn or R. The answer is that at a certain point, it can become worth it for a data science team to build out their own implementations in house. Understanding these concepts is most important at companies where the product is defined by the data and small improvements in predictive performance or algorithm optimization can lead to huge wins for the company.

“Data scientist” is often used as a blanket title to describe jobs that are drastically different. tweet
Data Munging: Often times, the data you’re analyzing is going to be messy and difficult to work with. Because of this, it’s really important to know how to deal with imperfections in data. Some examples of data imperfections include missing values, inconsistent string formatting (e.g., ‘New York’ versus ‘new york’ versus ‘ny’), and date formatting (‘2014-01-01’ vs. ‘01/01/2014’, unix time vs. timestamps, etc.). This will be most important at small companies where you’re an early data hire, or data-driven companies where the product is not data-related (particularly because the latter has often grown quickly with not much attention to data cleanliness), but this skill is important for everyone to have.

Data Visualization & Communication: Visualizing and communicating data is incredibly important, especially at young companies who are making data-driven decisions for the first time or companies where data scientists are viewed as people who help others make data-driven decisions. When it comes to communicating, this means describing your findings or the way techniques work to audiences, both technical and non-technical. Visualization wise, it can be immensely helpful to be familiar with data visualization tools like ggplot and d3.js. It is important to not just be familiar with the tools necessary to visualize data, but also the principles behind visually encoding data and communicating information.

Software Engineering: If you’re interviewing at a smaller company and are one of the first data science hires, it can be important to have a strong software engineering background. You’ll be responsible for handling a lot of data logging, and potentially the development of data-driven products.

Thinking Like A Data Scientist: Companies want to see that you’re a (data-driven) problem solver. That is, at some point during your interview process, you’ll probably be asked about some high level problem – for example, about a test the company may want to run or a data-driven product it may want to develop. It’s important to think about what things are important, and what things aren’t. How should you, as the data scientist, interact with the engineers and product managers? What methods should you use? When do approximations make sense?

Data science is still nascent and ill-defined as a field. Getting a job is as much about finding a company whose needs match your skills as it is developing those skills. This writing is based on my own firsthand experiences – I’d love to hear if you’ve had similar (or contrasting) experiences during your own process.


Data_Science_VD.png



Nguồn :
http://blog.udacity.com/2014/11/data-science-job-skills.html


“UC Irvine is uniquely positioned to be a leader in data science education, because it is one of the very few universities in the United States where statistics and computer science are both organizationally and physically together, allowing faculty to continue their close collaboration.”

http://datascience.uci.edu/data-science-degree/

(Nếu tối nay rãnh sẽ viết tiếp . Tamvo sẽ nói thêm chi tiết hơn về lãnh vực quảng cáo mà data scientist đang làm mưa làm gió hiện nay... và cuộc chiến giữa các đại công ty hàng đầu của Mỹ đang giành thị trường trị giá hàng chục tỷ USD nhờ vào Data Science )
 
Hạng C
7/2/17
668
67.339
93
NU! Dũa móng từ 9h sáng tới 9h tối, tuần nghỉ dc 1 ngày, ko có long vacation, ko có insurance... Lương 36k - 70k tùy trình độ. Ko có khả năng dc tăng lương, trừ khi lên làm chủ, mà làm chủ thì quên mẹ thời gian cho gia đình đi nha.

Làm DS làm từ 9h sáng tới 5h chiều, có thể work from home, cuối tuần nghỉ, annual leave 30 ngày, đầy đủ insurance. Lương ít nhất 80k/ năm cho entry level và tăng đều.

Cuộc sống ko chỉ đo bằng tiền! Tiền tiền cái củ cải
Mèo chỉ biết mỗi tiền nên miễn bàn. Thớt sản xuất thì ảnh đề xuất mua đất phân lô bán nền. Thớt khoa học thì ảnh khuyên đi làm nail. :). Vui phát hoảng.
 
Hạng D
4/5/12
4.401
26.585
175
8 năng khiếu cần thiết để trở thành data scientist hay data science engineer :

(Nếu không hiểu nổi tiếng Anh thì nhờ Mr. Goo nha anh em)

Basic Tools: No matter what type of company you’re interviewing for, you’re likely going to be expected to know how to use the tools of the trade. This means a statistical programming language, like R or Python, and a database querying language like SQL.

Basic Statistics: At least a basic understanding of statistics is vital as a data scientist. An interviewer once told me that many of the people he interviewed couldn’t even provide the correct definition of a p-value. You should be familiar with statistical tests, distributions, maximum likelihood estimators, etc. Think back to your basic stats class! This will also be the case for machine learning, but one of the more important aspects of your statistics knowledge will be understanding when different techniques are (or aren’t) a valid approach. Statistics is important at all company types, but especially data-driven companies where the product is not data-focused and product stakeholders will depend on your help to make decisions and design / evaluate experiments.

Machine Learning: If you’re at a large company with huge amounts of data, or working at a company where the product itself is especially data-driven, it may be the case that you’ll want to be familiar with machine learning methods. This can mean things like k-nearest neighbors, random forests, ensemble methods – all of the machine learning buzzwords. It’s true that a lot of these techniques can be implemented using R or Python libraries – because of this, it’s not necessarily a dealbreaker if you’re not the world’s leading expert on how the algorithms work. More important is to understand the broadstrokes and really understand when it is appropriate to use different techniques.

Multivariable Calculus and Linear Algebra: You may in fact be asked to derive some of the machine learning or statistics results you employ elsewhere in your interview. Even if you’re not, your interviewer may ask you some basic multivariable calculus or linear algebra questions, since they form the basis of a lot of these techniques. You may wonder why a data scientist would need to understand this stuff if there are a bunch of out of the box implementations in sklearn or R. The answer is that at a certain point, it can become worth it for a data science team to build out their own implementations in house. Understanding these concepts is most important at companies where the product is defined by the data and small improvements in predictive performance or algorithm optimization can lead to huge wins for the company.

“Data scientist” is often used as a blanket title to describe jobs that are drastically different. tweet
Data Munging: Often times, the data you’re analyzing is going to be messy and difficult to work with. Because of this, it’s really important to know how to deal with imperfections in data. Some examples of data imperfections include missing values, inconsistent string formatting (e.g., ‘New York’ versus ‘new york’ versus ‘ny’), and date formatting (‘2014-01-01’ vs. ‘01/01/2014’, unix time vs. timestamps, etc.). This will be most important at small companies where you’re an early data hire, or data-driven companies where the product is not data-related (particularly because the latter has often grown quickly with not much attention to data cleanliness), but this skill is important for everyone to have.

Data Visualization & Communication: Visualizing and communicating data is incredibly important, especially at young companies who are making data-driven decisions for the first time or companies where data scientists are viewed as people who help others make data-driven decisions. When it comes to communicating, this means describing your findings or the way techniques work to audiences, both technical and non-technical. Visualization wise, it can be immensely helpful to be familiar with data visualization tools like ggplot and d3.js. It is important to not just be familiar with the tools necessary to visualize data, but also the principles behind visually encoding data and communicating information.

Software Engineering: If you’re interviewing at a smaller company and are one of the first data science hires, it can be important to have a strong software engineering background. You’ll be responsible for handling a lot of data logging, and potentially the development of data-driven products.

Thinking Like A Data Scientist: Companies want to see that you’re a (data-driven) problem solver. That is, at some point during your interview process, you’ll probably be asked about some high level problem – for example, about a test the company may want to run or a data-driven product it may want to develop. It’s important to think about what things are important, and what things aren’t. How should you, as the data scientist, interact with the engineers and product managers? What methods should you use? When do approximations make sense?

Data science is still nascent and ill-defined as a field. Getting a job is as much about finding a company whose needs match your skills as it is developing those skills. This writing is based on my own firsthand experiences – I’d love to hear if you’ve had similar (or contrasting) experiences during your own process.


Data_Science_VD.png



Nguồn :
http://blog.udacity.com/2014/11/data-science-job-skills.html


“UC Irvine is uniquely positioned to be a leader in data science education, because it is one of the very few universities in the United States where statistics and computer science are both organizationally and physically together, allowing faculty to continue their close collaboration.”

http://datascience.uci.edu/data-science-degree/

(Nếu tối nay rãnh sẽ viết tiếp ... )
Nhắc bác xíu không nên nhầm lẫn học ngành data science ra là thành data scientist nha anh. Bài đầu anh bảo học ra thành Data Scientist nên em mới nghĩ ngay là phải lên tới PhD vì đi sâu về nghiên cứu. Nên nếu chỉ ở mức kỹ sư xin anh đừng dùng từ Data Scientist, nó làm giảm giá trị của người làm nghiên cứu khoa học nhé. Dùng từ data science engineer là đúng nhất. Kiểu như VN giờ dùng từ ngữ đao to búa lớn quen rồi, làm mấy cái vẽ thiết kế hệ thống thì gọi là technical architect, hay làm tính toán đếm số cho vô cái vị trí chức danh data scientist. Trong khi đúng ra chỉ gọi ở mức technical leader hoặc data engineer là hết rồi.
 
Hạng D
26/10/10
1.676
14.509
113
Nhắc bác xíu không nên nhầm lẫn học ngành data science ra là thành data scientist nha anh. Bài đầu anh bảo học ra thành Data Scientist nên em mới nghĩ ngay là phải lên tới PhD vì đi sâu về nghiên cứu. Nên nếu chỉ ở mức kỹ sư xin anh đừng dùng từ Data Scientist, nó làm giảm giá trị của người làm nghiên cứu khoa học nhé. Dùng từ data science engineer là đúng nhất. Kiểu như VN giờ dùng từ ngữ đao to búa lớn quen rồi, làm mấy cái vẽ thiết kế hệ thống thì gọi là technical architect, hay làm tính toán đếm số cho vô cái vị trí chức danh data scientist. Trong khi đúng ra chỉ gọi ở mức technical leader hoặc data engineer là hết rồi.


Data Scientist trong bài này là do lấy từ bài blog của cái link (https://blog.udacity.com/2014/11/data-science-job-skills.html )

Điều mà bác nhầm là data scientist không nhất thiết phải có bằng PhD . Nhiều người có bằng BS làm việc lâu năm và giỏi cũng được hãng cho cái title "data scientist" , trái lại nhiều người có bằng PhD nhưng trình kém không những không được gọi là data scientist mà còn bị đào thải nhanh chóng !
 
Hạng C
13/4/15
980
91.287
93
Em sai lầm khi chọn low level của ngành IT này quá rồi :(
Giờ chuyển từ chip sang DS, AI còn kịp không mấy anh ơi.
 
Hạng B1
11/10/16
51
2.118
83
25
Sao các anh ko học civil engineer như kềnh nhĩ

sao 5 năm lên Dc project manager ko dưới 200k chưa kể xe và 10% bonus

haizzzzz
 
  • Like
Reactions: hoangquysg
Bò Hóng
22/1/13
1.549
33.180
113
NU! Dũa móng từ 9h sáng tới 9h tối, tuần nghỉ dc 1 ngày, ko có long vacation, ko có insurance... Lương 36k - 70k tùy trình độ. Ko có khả năng dc tăng lương, trừ khi lên làm chủ, mà làm chủ thì quên mẹ thời gian cho gia đình đi nha.

Làm DS làm từ 9h sáng tới 5h chiều, có thể work from home, cuối tuần nghỉ, annual leave 30 ngày, đầy đủ insurance. Lương ít nhất 80k/ năm cho entry level và tăng đều.

Cuộc sống ko chỉ đo bằng tiền! Tiền tiền cái củ cải

Thế à

vậy khả năng 1 anh từ Dũa móng sang DS có dễ không

hay là từ DS bỏ về ngồi dũa móng nó khó


Nói như anh thì việc đoé rì phải ngồi dũa móng hay mần DS làm chi ... ngồi nghĩ ra cái gì giống như Facebook đó ,.. có tỉ đô la ngay.
 
  • Like
Reactions: ngocquang19877
Hạng D
4/5/12
4.401
26.585
175
Data Scientist trong bài này là do lấy từ bài blog của cái link (https://blog.udacity.com/2014/11/data-science-job-skills.html )

Điều mà bác nhầm là data scientist không nhất thiết phải có bằng PhD . Nhiều người có bằng BS làm việc lâu năm và giỏi cũng được hãng cho cái title "data scientist" , trái lại nhiều người có bằng PhD nhưng trình kém không những không được gọi là data scientist mà còn bị đào thải nhanh chóng !
Theo quan niệm của em thì lại nghĩ cái đó như là cái học vị, không phản ánh cái trình độ, chắc quan niệm hơi cổ hủ xíu. Như VN, giáo sư, tiến sỹ đều là học vị, nhà khoa học cũng là học vị. Phải có học vị mới được gọi là khoa học, còn không thì không gọi.