Viết tiếp theo bài hôm qua :
Data analysis đã áp dụng từ lâu trong y khoa và các công ty dược từ việc chuẩn đoán bệnh, dư đoán những khối u có trở nên ác tính hay không, phác đồ điều trị và việc phát minh ra những loại thuốc mới đã đem lại những thành tựu vượt bậc... Tuy nhiên môn này gặp nhiều hạn chế như việc collect data, thiết bị lưu trữ... tốn thời gian và rất mắc và họ chỉ được dùng ngôn ngữ SAS là ngôn ngữ được FDA chấp nhận trong các báo cáo nên môn này chỉ có ở những trung tâm nghiên cứu và bệnh viện lớn, ít phổ biến ra ngoài... (FDA là Food and Drug Administration là cơ quan quản lý thực phẩm và dược phẩm của Hoa Kỳ, thuộc Bộ Y tế và Dịch vụ Nhân sinh Hoa Kỳ.)
Một trong những người đi đầu trong lãnh vực này là một bác sĩ Việt Nam - Nguyễn Văn Tuấn - hiện đang giảng dạy tại New South Wales. Bác sĩ Tuấn đem bộ môn này dạy cho các bác sỉ ở VN và dùng ngôn ngữ R
http://vi.wikipedia.org/wiki/Nguyễn_Văn_Tuấn_(giáo_sư_dịch_tễ_học)
Theo thời gian, các công ty kỹ thuật phát triễn cho ra đời những thiết bị lưu trữ lớn hơn, rẻ hơn, hàng loạt các công ty thương mại điện tử xuất hiện cộng với những ngôn ngữ hỗ trợ như R, python... Data science đã vượt khỏi phạm vi nhỏ hẹp của y khoa và được sử dụng rộng rãi hơn, giải quyết các nhu cầu xã hội... Tamvo đơn cử 2 ứng dụng về data science nổii trội, có liên quan đến đời sống và cũng ít người biết...
1. Quảng cáo:
Thị trường quảng cáo online ở Mỹ chiếm 6% mà có giá trị 70 tỷ. Thị trường này nằm trong tay các đại công ty như google, facebook, yahoo... Trong những năm gần đây, các hình thức quảng cáo truyền thống như qua truyền hình, phát thanh đã và đang chuyển qua online... thị phần tăng và xuất hiện thêm những đối thủ cạnh tranh là những đại công ty truyền thông... cách thức quảng cáo online đã khác trước rất nhiều đó là họ nhắm mục tiêu đúng đối tượng...
Các công ty quảng cáo thu thập data của mọi người, mỗi người họ có từ 8 ngàn đến 10 ngàn thói quen mua sắm từ bạn mua cái khăn, cái kềm, sữa cho em bé cho đến thức ăn chó mèo... bạn mua ở đâu, mua loại nào, cách mua là order từ desktop hay có thói quen xem quảng cáo trên phone, tablet mà lại thích walk in ra store để mua... càng nhiều, càng chi tiết càng tốt... thói quen của bạn được họ update hàng ngày...
Khi công ty quảng cáo nhận được hợp đồng quảng cáo ví dụ là thức ăn cho chó, họ sẽ lọc trong data của họ ra những người nuôi chó và gởi đến cư dân mạng . Lây thí dụ như họ gởi đến người nuôi chó chihuahua sẽ nhận được hình ảnh chihuahua, người nuôi Becgie thì nhân được hình ảnh Becgie chứ như Oser đang nuôi Chihuahua mà gởi đến hình Becgie thì Oser đâu có xem... Chính xác hơn nữa là họ biết sẽ gởi lúc nào mà bạn thường online và nếu qua email thì email nào bạn thường vào... Cho nên các bạn để ý những năm gần đây các bạn nhận được quảng cáo đa số chính xác cái bạn đang cần nên ít bực mình hơn vì bị quấy rầy, thậm chí nghi ngờ mình đang bị theo dõi
Các bạn OS có đi mua đồ, các bạn yên tâm là tên bạn và từ 8 đến 10 ngàn thói quen của bạn đã nằm trong tay các công ty quảng cáo... làm sao mà có thể thu thập được 8 đến 10 ngàn thói quen của bạn ? Đó là công việc của Data Science, họ dựa vào vài chục thói quen của bạn, dựa vào những nhóm người khác mà bạn được xếp loại, từ đó tìm ra những cái còn thiếu...Ngoài ra họ còn có khả năng "trace" bạn được lúc offline ví dụ như họ nhận được hợp đồng quảng cáo bán kim cương, vì ít có ai mua kim cương online lắm mà thường đến tiệm mua. Các công ty quảng cáo phải tìm được được người này là khách hàng của họ, họ gởi quảng cáo kim cương và người này xem quảng cáo rồi sau đó mới đến store mua... từ đó công ty quảng cáo mới gởi bảng report lại cho công ty bán kim cương...
Công ty quảng cáo bây giờ biết thói quen của bạn, biết cách contact bạn lúc nào và như thế nào, biết bạn mua gì ở đâu và sẽ mua gì còn nhiều và chính xác hơn vợ của các bạn nữa...!!!
Một ứng dụng khác của Data Science mà các công ty lớn đang xài , nhất là các công ty đang xài HR (Human Resources) của công ty khác vì không muốn trách nhiệm về benefit và có thể đẩy bạn ra đi bất cứ lúc nào . Cứ mỗi 2 tuần bạn "submit" thời gian làm việc, sếp xác nhận, rồi HR sẽ làm phần việc còn lại là tính toán, gởi ngân phiếu về hay chuyển khoản trực tiếp vào tài khoản của bạn . Các công ty HR này cũng thu gom một lượng data khổng lồ về bạn. Người ta biết rõ bạn đã từng làm ở đâu, vị trí gì, mức lương bao nhiêu... ai là đồng nghiệp, ai là Sếp...Nhờ có lượng data phong phú về bạn, thường xuyên update, họ biết bạn gần đây có quan tâm đến job khác hay không? có công ty nào đang đang rủ bạn qua làm hay bạn đang có ý định tìm chỗ làm mới...từ đó họ sẽ gởi report đến sếp của bạn là bạn sẽ là người có khả năng ra đi vì lương thấp hay vi trí thấp để Sếp của bạn điều chỉnh mức lương, tăng vị trí để giữ bạn .... hoặc chuẫn bị người backup công việc bạn đang làm... chuẩn bị thuê người mới... Các công ty HR đang chào mời khách hàng của họ mua thêm phần services này...Nước ta chưa có công ty nào mua phần mềm này nhưng tương lai gần sẽ có ...
Tới giờ hẹn Sambo đi uống cà phê rồi, thôi tạm ngừng ở đây...chiều tối nếu rãnh sẽ viết tiếp
Data analysis đã áp dụng từ lâu trong y khoa và các công ty dược từ việc chuẩn đoán bệnh, dư đoán những khối u có trở nên ác tính hay không, phác đồ điều trị và việc phát minh ra những loại thuốc mới đã đem lại những thành tựu vượt bậc... Tuy nhiên môn này gặp nhiều hạn chế như việc collect data, thiết bị lưu trữ... tốn thời gian và rất mắc và họ chỉ được dùng ngôn ngữ SAS là ngôn ngữ được FDA chấp nhận trong các báo cáo nên môn này chỉ có ở những trung tâm nghiên cứu và bệnh viện lớn, ít phổ biến ra ngoài... (FDA là Food and Drug Administration là cơ quan quản lý thực phẩm và dược phẩm của Hoa Kỳ, thuộc Bộ Y tế và Dịch vụ Nhân sinh Hoa Kỳ.)
Một trong những người đi đầu trong lãnh vực này là một bác sĩ Việt Nam - Nguyễn Văn Tuấn - hiện đang giảng dạy tại New South Wales. Bác sĩ Tuấn đem bộ môn này dạy cho các bác sỉ ở VN và dùng ngôn ngữ R
http://vi.wikipedia.org/wiki/Nguyễn_Văn_Tuấn_(giáo_sư_dịch_tễ_học)
Theo thời gian, các công ty kỹ thuật phát triễn cho ra đời những thiết bị lưu trữ lớn hơn, rẻ hơn, hàng loạt các công ty thương mại điện tử xuất hiện cộng với những ngôn ngữ hỗ trợ như R, python... Data science đã vượt khỏi phạm vi nhỏ hẹp của y khoa và được sử dụng rộng rãi hơn, giải quyết các nhu cầu xã hội... Tamvo đơn cử 2 ứng dụng về data science nổii trội, có liên quan đến đời sống và cũng ít người biết...
1. Quảng cáo:
Thị trường quảng cáo online ở Mỹ chiếm 6% mà có giá trị 70 tỷ. Thị trường này nằm trong tay các đại công ty như google, facebook, yahoo... Trong những năm gần đây, các hình thức quảng cáo truyền thống như qua truyền hình, phát thanh đã và đang chuyển qua online... thị phần tăng và xuất hiện thêm những đối thủ cạnh tranh là những đại công ty truyền thông... cách thức quảng cáo online đã khác trước rất nhiều đó là họ nhắm mục tiêu đúng đối tượng...
Các công ty quảng cáo thu thập data của mọi người, mỗi người họ có từ 8 ngàn đến 10 ngàn thói quen mua sắm từ bạn mua cái khăn, cái kềm, sữa cho em bé cho đến thức ăn chó mèo... bạn mua ở đâu, mua loại nào, cách mua là order từ desktop hay có thói quen xem quảng cáo trên phone, tablet mà lại thích walk in ra store để mua... càng nhiều, càng chi tiết càng tốt... thói quen của bạn được họ update hàng ngày...
Khi công ty quảng cáo nhận được hợp đồng quảng cáo ví dụ là thức ăn cho chó, họ sẽ lọc trong data của họ ra những người nuôi chó và gởi đến cư dân mạng . Lây thí dụ như họ gởi đến người nuôi chó chihuahua sẽ nhận được hình ảnh chihuahua, người nuôi Becgie thì nhân được hình ảnh Becgie chứ như Oser đang nuôi Chihuahua mà gởi đến hình Becgie thì Oser đâu có xem... Chính xác hơn nữa là họ biết sẽ gởi lúc nào mà bạn thường online và nếu qua email thì email nào bạn thường vào... Cho nên các bạn để ý những năm gần đây các bạn nhận được quảng cáo đa số chính xác cái bạn đang cần nên ít bực mình hơn vì bị quấy rầy, thậm chí nghi ngờ mình đang bị theo dõi
Các bạn OS có đi mua đồ, các bạn yên tâm là tên bạn và từ 8 đến 10 ngàn thói quen của bạn đã nằm trong tay các công ty quảng cáo... làm sao mà có thể thu thập được 8 đến 10 ngàn thói quen của bạn ? Đó là công việc của Data Science, họ dựa vào vài chục thói quen của bạn, dựa vào những nhóm người khác mà bạn được xếp loại, từ đó tìm ra những cái còn thiếu...Ngoài ra họ còn có khả năng "trace" bạn được lúc offline ví dụ như họ nhận được hợp đồng quảng cáo bán kim cương, vì ít có ai mua kim cương online lắm mà thường đến tiệm mua. Các công ty quảng cáo phải tìm được được người này là khách hàng của họ, họ gởi quảng cáo kim cương và người này xem quảng cáo rồi sau đó mới đến store mua... từ đó công ty quảng cáo mới gởi bảng report lại cho công ty bán kim cương...
Công ty quảng cáo bây giờ biết thói quen của bạn, biết cách contact bạn lúc nào và như thế nào, biết bạn mua gì ở đâu và sẽ mua gì còn nhiều và chính xác hơn vợ của các bạn nữa...!!!
Một ứng dụng khác của Data Science mà các công ty lớn đang xài , nhất là các công ty đang xài HR (Human Resources) của công ty khác vì không muốn trách nhiệm về benefit và có thể đẩy bạn ra đi bất cứ lúc nào . Cứ mỗi 2 tuần bạn "submit" thời gian làm việc, sếp xác nhận, rồi HR sẽ làm phần việc còn lại là tính toán, gởi ngân phiếu về hay chuyển khoản trực tiếp vào tài khoản của bạn . Các công ty HR này cũng thu gom một lượng data khổng lồ về bạn. Người ta biết rõ bạn đã từng làm ở đâu, vị trí gì, mức lương bao nhiêu... ai là đồng nghiệp, ai là Sếp...Nhờ có lượng data phong phú về bạn, thường xuyên update, họ biết bạn gần đây có quan tâm đến job khác hay không? có công ty nào đang đang rủ bạn qua làm hay bạn đang có ý định tìm chỗ làm mới...từ đó họ sẽ gởi report đến sếp của bạn là bạn sẽ là người có khả năng ra đi vì lương thấp hay vi trí thấp để Sếp của bạn điều chỉnh mức lương, tăng vị trí để giữ bạn .... hoặc chuẫn bị người backup công việc bạn đang làm... chuẩn bị thuê người mới... Các công ty HR đang chào mời khách hàng của họ mua thêm phần services này...Nước ta chưa có công ty nào mua phần mềm này nhưng tương lai gần sẽ có ...
Tới giờ hẹn Sambo đi uống cà phê rồi, thôi tạm ngừng ở đây...chiều tối nếu rãnh sẽ viết tiếp