We confirmed
Hạng B2
17/11/11
469
3.299
93
https://en.m.wikipedia.org/wiki/R_(programming_language)
R là ngôn ngữ thông dịch dạng Matlab bác ạ, hiểu khái niệm data processing để biết làm gì, dùng hàm gì cho mục đích cần xử lý mới khó chứ học ngôn ngữ R mà có background cs thì không quá 2 tuần.

Một người chưa code R nhưng experts về Matlab và programming java, python, php cho biết.
Mảng này không phải chuyên môn nên mình tin bác nói đúng :)

Trễ rồi nhưng vì topic hợp với bản thân nên mình mở máy tính đánh cho nhanh và cũng muốn chia sẽ những gì mình biết. Bởi lẽ, mình tin là người VN có đủ khả năng để dẫn dắt người khác trên lĩnh vực này.

Data scientist/ data science/ data analytic...: Đây là mảng rất hot, không chỉ hot ở Mỹ mà hot ở bất cứ nơi đâu. Và ai đang dẫn dắt ngành này về khoản nhân tài... đáng tiếc đó lại là người Ấn Độ. Những năm trước, đi đâu cũng nghe Ấn Độ là giỏi IT/ computer science. Nhưng gần đây, Ấn Độ rộ lên là cái rổ nhân tài cho lĩnh vực này. 2 công ty mạnh nhất về mảng này chuyên làm dịch vụ cho các công ty đa quốc gia lại là do người Ấn sáng lập và đặt ở Chicago. Vậy người VN mình làm thế nào để cạnh tranh lại? Dẫu biết ngành này liên quan tới lập trình, máy tính,... Mình xin phép chia sẻ kinh nghiệm bản thân, đó là nghệ thuật kết hợp giữa data science với statistics và với business. Bởi lẽ, tất cả những gì data science mang lại cũng chỉ phục vụ 1 mục đích duy nhất, đó là góp phần đưa ra quyết định kinh doanh chính xác nhất có thể. Nôm na gọi là Decision Science. Và tại sao có vai trò của statistics (đúng hơn là advanced statistics). Bởi vì hiện thời chưa có nhiều người giỏi cả 2 mảng này cộng lại.

Những ngành gọi là mỏ vàng của data science hay data analytic được chia làm 2 loại. Non-digital và Digital. Mảng non-digital tương đối dễ hơn vì chỉ xử lý ở bề rộng và độ lớn data nhiều hơn, vd như ngân hàng, bảo hiểm. Mảng digital khó hơn vì đòi hỏi sự hiểu rõ ý nghĩa của từng loại data, nhưng lại là mỏ vàng trong tương lai nếu bạn SV tìm tòi từ bây giờ, vd như Facebook, Google, và tất cả các công ty khác kể cả ngân hàng, bảo hiểm.

Lan mang quá nên ai hỏi gì mình trả lời tiếp :D
 
We confirmed
Hạng B2
17/11/11
469
3.299
93
Dzờ học lấy background thì học course này OK ko @We nhễ?


https://m.youtube.com/watch?v=BwjBrRJuXhA
Có giờ cứ học đi anh. Cái này là basic stat. Như mình chia sẽ. 2 bạn data scientist và statistician nên đi đồng hành. Nhưng cuối cùng, không nên làm phức tạp hoá vấn đề ve chạy model phức tạp v...v... vì cuối cùng đó là mình cần đưa ra quyết định kinh doanh chính xác và nhanh nhất.
 
Hạng F
2/3/14
12.223
128.881
113
Mảng này không phải chuyên môn nên mình tin bác nói đúng :)

Trễ rồi nhưng vì topic hợp với bản thân nên mình mở máy tính đánh cho nhanh và cũng muốn chia sẽ những gì mình biết. Bởi lẽ, mình tin là người VN có đủ khả năng để dẫn dắt người khác trên lĩnh vực này.

Data scientist/ data science/ data analytic...: Đây là mảng rất hot, không chỉ hot ở Mỹ mà hot ở bất cứ nơi đâu. Và ai đang dẫn dắt ngành này về khoản nhân tài... đáng tiếc đó lại là người Ấn Độ. Những năm trước, đi đâu cũng nghe Ấn Độ là giỏi IT/ computer science. Nhưng gần đây, Ấn Độ rộ lên là cái rổ nhân tài cho lĩnh vực này. 2 công ty mạnh nhất về mảng này chuyên làm dịch vụ cho các công ty đa quốc gia lại là do người Ấn sáng lập và đặt ở Chicago. Vậy người VN mình làm thế nào để cạnh tranh lại? Dẫu biết ngành này liên quan tới lập trình, máy tính,... Mình xin phép chia sẻ kinh nghiệm bản thân, đó là nghệ thuật kết hợp giữa data science với statistics và với business. Bởi lẽ, tất cả những gì data science mang lại cũng chỉ phục vụ 1 mục đích duy nhất, đó là góp phần đưa ra quyết định kinh doanh chính xác nhất có thể. Nôm na gọi là Decision Science. Và tại sao có vai trò của statistics (đúng hơn là advanced statistics). Bởi vì hiện thời chưa có nhiều người giỏi cả 2 mảng này cộng lại.

Những ngành gọi là mỏ vàng của data science hay data analytic được chia làm 2 loại. Non-digital và Digital. Mảng non-digital tương đối dễ hơn vì chỉ xử lý ở bề rộng và độ lớn data nhiều hơn, vd như ngân hàng, bảo hiểm. Mảng digital khó hơn vì đòi hỏi sự hiểu rõ ý nghĩa của từng loại data, nhưng lại là mỏ vàng trong tương lai nếu bạn SV tìm tòi từ bây giờ, vd như Facebook, Google, và tất cả các công ty khác kể cả ngân hàng, bảo hiểm.

Lan mang quá nên ai hỏi gì mình trả lời tiếp :D
Mình đồng ý với bác là mảng này rất tiềm năng ngay cả ở Việt Nam, mình có kể ở trên rồi đó, rất nhiều công ty Việt Nam có dữ liệu khổng lồ mà chưa tận dụng hết : bank, viettel, vinaphone, xông ty xuất nhập khẩu, tiki, masan, vinamilk, vv... nhiều lắm. Mấy anh như Mèo không hiểu thì nói DS xa vời, áp dụng ở đâu chứ Việt Nam thì không, là vì chưa hiểu. Như bác nói, data science mục đích là giúp ra decisions tối ưu hơn, target nhiều khách hàng hơn, vv... (cần sự kết hợp kiến thức của ngành nghề cụ thể để biết look for cái gì và đánh giá kết quả xử lý) nên doanh nghiệp dù là Việt Nam nói trên tất nhiên là cũng hứng thú, tiềm năng không nhỏ.
 
  • Like
Reactions: ngr040
Hạng F
2/3/14
12.223
128.881
113
Bác @We

Đáng lẽ các công ty software lớn như Bkav hay FPT kết hợp với data scientist là người có kinh nghiệm trong các lĩnh vực kiểu như bác để làm ra các giải pháp về data science cho doanh nghiệp Việt và tiến tới xuất khẩu chất xám thì không làm, khỏi phải dùng đồ của Ấn, lại đâm đầu đi làm ba cái BPhone tào lao chết từ trong trứng.
 
Hạng C
14/6/11
693
33.046
93
Long An
Cái dạng ví dụ này là statistics và probability theory thôi, có lâu rồi, không phải data science gì :)

1. Cái trên là bàn về data analysis, stat. concept/technique.
2. Mấy cái trên ko là nền tảng để học tiếp DS thì cái gì mới là nền tảng để nắm DS?
 
  • Like
Reactions: Fordescape
Hạng F
2/3/14
12.223
128.881
113
1. Cái trên là bàn về data analysis, advance stat. concept/technique.
2. Mấy cái trên ko là nền tảng để học tiếp DS thì cái gì mới là nền tảng để nắm DS?
Ờ, là nền tảng, đồng ý 100% :)
 
We confirmed
Hạng B2
17/11/11
469
3.299
93
Bác @We

Đáng lẽ các công ty software lớn như Bkav hay FPT kết hợp với data scientist là người có kinh nghiệm trong các lĩnh vực kiểu như bác để làm ra các giải pháp về data science cho doanh nghiệp Việt và tiến tới xuất khẩu chất xám thì không làm, lại đâm đầu đi làm ba cái BPhone tào lao chết từ trong trứng.
Mình thừa nhận mình không phải data scientist nhưng background là stastistic và business nên may mắn được làm việc với 1 đội ngũ DS trong nhà lẫn cty chuyên làm dịch vụ DS. Mình luôn trân trọng sự hiểu biết và kỹ thuật của các bạn DS và phần lớn họ là người Ấn Độ. Cái mình tin là người VN có thể cạnh tranh trực tiếp với Ấn Độ nhưng xoáy sâu vào mảng statistics nữa, như vậy có thể dẫn dắt các nước khác. Ngoại trừ các ông khủng như Google, Facebook,... trong hệ thống các cty non-tech như ngành hàng tiêu dùng nhanh, dược, ngân hàng, v...v... thật ra người Mỹ có khi còn phải đi học người Châu Á. Vd ở cty mình, các bạn Mỹ còn phải bay qua châu á học các bạn Hàn Quốc/ TQ/ Singapore. Tiện đây, trong 1-2 năm nữa mình tin Singapore sẽ là hub của ngành DS.
 
We confirmed
Hạng B2
17/11/11
469
3.299
93
8 nhiều rồi bữa nào các anh cần đạm đạo thêm ghé hủ tiếu mỹ tho Hai Chi số 21 Hoa Mai (trên facebook là hutieumythohaichi) gặp em nha. Em ngoài giờ đi làm có bán thêm hủ tiếu ngon và sạch :D hơi lố xíu nhưng cho em quảng cáo tí.
Định hướng cho con cái du học - học ngành gì ?
 
Hạng F
2/3/14
12.223
128.881
113
Mình thừa nhận mình không phải data scientist nhưng background là stastistic và business nên may mắn được làm việc với 1 đội ngũ DS trong nhà lẫn cty chuyên làm dịch vụ DS. Mình luôn trân trọng sự hiểu biết và kỹ thuật của các bạn DS và phần lớn họ là người Ấn Độ. Cái mình tin là người VN có thể cạnh tranh trực tiếp với Ấn Độ nhưng xoáy sâu vào mảng statistics nữa, như vậy có thể dẫn dắt các nước khác. Ngoại trừ các ông khủng như Google, Facebook,... trong hệ thống các cty non-tech như ngành hàng tiêu dùng nhanh, dược, ngân hàng, v...v... thật ra người Mỹ có khi còn phải đi học người Châu Á. Vd ở cty mình, các bạn Mỹ còn phải bay qua châu á học các bạn Hàn Quốc/ TQ/ Singapore. Tiện đây, trong 1-2 năm nữa mình tin Singapore sẽ là hub của ngành DS.
Như bác biết, technique là chung nhưng thị trường mỗi nước có đặc thù riêng nên cần người hiểu local market. Hai là cái này là chất xám. Nên mình thấy người Việt Nam lĩnh vực này cạnh tranh tốt cả trong nước và giỏi thì cạnh tranh việc làm cả khu vực luôn như bác. Thị trường sẽ còn cần nhiều data service, công ty DS Việt Nam chịu khó đầu tư bây giờ cũng tiến tới cạnh tranh khu vực được.
 
  • Like
Reactions: ngr040
We confirmed
Hạng B2
17/11/11
469
3.299
93
Viết tiếp theo bài hôm qua :


Data analysis đã áp dụng từ lâu trong y khoa và các công ty dược từ việc chuẩn đoán bệnh, dư đoán những khối u có trở nên ác tính hay không, phác đồ điều trị và việc phát minh ra những loại thuốc mới đã đem lại những thành tựu vượt bậc... Tuy nhiên môn này gặp nhiều hạn chế như việc collect data, thiết bị lưu trữ... tốn thời gian và rất mắc và họ chỉ được dùng ngôn ngữ SAS là ngôn ngữ được FDA chấp nhận trong các báo cáo nên môn này chỉ có ở những trung tâm nghiên cứu và bệnh viện lớn, ít phổ biến ra ngoài... (FDA là Food and Drug Administration là cơ quan quản lý thực phẩm và dược phẩm của Hoa Kỳ, thuộc Bộ Y tế và Dịch vụ Nhân sinh Hoa Kỳ.)

Một trong những người đi đầu trong lãnh vực này là một bác sĩ Việt Nam - Nguyễn Văn Tuấn - hiện đang giảng dạy tại New South Wales. Bác sĩ Tuấn đem bộ môn này dạy cho các bác sỉ ở VN và dùng ngôn ngữ R

http://vi.wikipedia.org/wiki/Nguyễn_Văn_Tuấn_(giáo_sư_dịch_tễ_học)

Theo thời gian, các công ty kỹ thuật phát triễn cho ra đời những thiết bị lưu trữ lớn hơn, rẻ hơn, hàng loạt các công ty thương mại điện tử xuất hiện cộng với những ngôn ngữ hỗ trợ như R, python... Data science đã vượt khỏi phạm vi nhỏ hẹp của y khoa và được sử dụng rộng rãi hơn, giải quyết các nhu cầu xã hội... Tamvo đơn cử 2 ứng dụng về data science nổii trội, có liên quan đến đời sống và cũng ít người biết...

1. Quảng cáo:

Thị trường quảng cáo online ở Mỹ chiếm 6% mà có giá trị 70 tỷ. Thị trường này nằm trong tay các đại công ty như google, facebook, yahoo... Trong những năm gần đây, các hình thức quảng cáo truyền thống như qua truyền hình, phát thanh đã và đang chuyển qua online... thị phần tăng và xuất hiện thêm những đối thủ cạnh tranh là những đại công ty truyền thông... cách thức quảng cáo online đã khác trước rất nhiều đó là họ nhắm mục tiêu đúng đối tượng...

Các công ty quảng cáo thu thập data của mọi người, mỗi người họ có từ 8 ngàn đến 10 ngàn thói quen mua sắm từ bạn mua cái khăn, cái kềm, sữa cho em bé cho đến thức ăn chó mèo... bạn mua ở đâu, mua loại nào, cách mua là order từ desktop hay có thói quen xem quảng cáo trên phone, tablet mà lại thích walk in ra store để mua... càng nhiều, càng chi tiết càng tốt... thói quen của bạn được họ update hàng ngày...

Khi công ty quảng cáo nhận được hợp đồng quảng cáo ví dụ là thức ăn cho chó, họ sẽ lọc trong data của họ ra những người nuôi chó và gởi đến cư dân mạng . Lây thí dụ như họ gởi đến người nuôi chó chihuahua sẽ nhận được hình ảnh chihuahua, người nuôi Becgie thì nhân được hình ảnh Becgie chứ như Oser đang nuôi Chihuahua mà gởi đến hình Becgie thì Oser đâu có xem... Chính xác hơn nữa là họ biết sẽ gởi lúc nào mà bạn thường online và nếu qua email thì email nào bạn thường vào... Cho nên các bạn để ý những năm gần đây các bạn nhận được quảng cáo đa số chính xác cái bạn đang cần nên ít bực mình hơn vì bị quấy rầy, thậm chí nghi ngờ mình đang bị theo dõi :)

Các bạn OS có đi mua đồ, các bạn yên tâm là tên bạn và từ 8 đến 10 ngàn thói quen của bạn đã nằm trong tay các công ty quảng cáo... làm sao mà có thể thu thập được 8 đến 10 ngàn thói quen của bạn ? Đó là công việc của Data Science, họ dựa vào vài chục thói quen của bạn, dựa vào những nhóm người khác mà bạn được xếp loại, từ đó tìm ra những cái còn thiếu...Ngoài ra họ còn có khả năng "trace" bạn được lúc offline ví dụ như họ nhận được hợp đồng quảng cáo bán kim cương, vì ít có ai mua kim cương online lắm mà thường đến tiệm mua. Các công ty quảng cáo phải tìm được được người này là khách hàng của họ, họ gởi quảng cáo kim cương và người này xem quảng cáo rồi sau đó mới đến store mua... từ đó công ty quảng cáo mới gởi bảng report lại cho công ty bán kim cương...

Công ty quảng cáo bây giờ biết thói quen của bạn, biết cách contact bạn lúc nào và như thế nào, biết bạn mua gì ở đâu và sẽ mua gì còn nhiều và chính xác hơn vợ của các bạn nữa...!!!

Một ứng dụng khác của Data Science mà các công ty lớn đang xài , nhất là các công ty đang xài HR (Human Resources) của công ty khác vì không muốn trách nhiệm về benefit và có thể đẩy bạn ra đi bất cứ lúc nào . Cứ mỗi 2 tuần bạn "submit" thời gian làm việc, sếp xác nhận, rồi HR sẽ làm phần việc còn lại là tính toán, gởi ngân phiếu về hay chuyển khoản trực tiếp vào tài khoản của bạn . Các công ty HR này cũng thu gom một lượng data khổng lồ về bạn. Người ta biết rõ bạn đã từng làm ở đâu, vị trí gì, mức lương bao nhiêu... ai là đồng nghiệp, ai là Sếp...Nhờ có lượng data phong phú về bạn, thường xuyên update, họ biết bạn gần đây có quan tâm đến job khác hay không? có công ty nào đang đang rủ bạn qua làm hay bạn đang có ý định tìm chỗ làm mới...từ đó họ sẽ gởi report đến sếp của bạn là bạn sẽ là người có khả năng ra đi vì lương thấp hay vi trí thấp để Sếp của bạn điều chỉnh mức lương, tăng vị trí để giữ bạn .... hoặc chuẫn bị người backup công việc bạn đang làm... chuẩn bị thuê người mới... Các công ty HR đang chào mời khách hàng của họ mua thêm phần services này...Nước ta chưa có công ty nào mua phần mềm này nhưng tương lai gần sẽ có ...

Tới giờ hẹn Sambo đi uống cà phê rồi, thôi tạm ngừng ở đây...chiều tối nếu rãnh sẽ viết tiếp :)
Đọc kỹ bài của anh 2 lần. Anh nói rất chính xác. Rất cảm kích. Đích thực đây là người am hiểu DS.
 
  • Like
Reactions: Rusteze