Hihi ok con bê mà em kg phải chủ thớt. Em dự anh chủ thớt kg ở VN )Ok hôm nào ghé làm tô dặc biệt hủ tíu Mỹ Tho và cà đạo với chủ thớt
Kinh tế thì chỉ nên theo Toán thôi.cứ chọn nghanh kinh tế, nhưng mà vẫn nên chọn nghanh nó thik đã
Em không đọc hết, vì cái này em data_science em đã kể đâu đó trong CNL rồi; lý do là đứa cháu vợ nó chuyển ngành học master về cái này ở Mẽo -sau học xong nó làm cho cty quảng cáo bự ở NY-
Em xem nội dung thì đ.m. giống đến 70% cái mà em đã học và em rạc zái ra từ cáhc đây 20 năm, sau đó làm liên tục trong 5 năm nữa,... và cuối cùng ko làm được cái qué gì ra hồn, vác xác về quê làm thằng da đen...
-năm 2012-3 mức lương start cho thằng freshgraduate khoảng 70-90K/y; còn dạng có kinh nghiệm 4-5 năm thì ko dưới 150K/y, bonus này nọ chưa tính; thế mới đen chứ,.., mà còn chưa đen bằng cậu bạn em,...-
Từ điểm xuất phát củ chuối của em nó có nhiều tên gọi, mà em biết: scientific computing, simulation of continous system, computation of continum structure, data analysis and numerical methods in application on ...., nhưng tóm zái lại thì theo em biết nó là cái này -chắc ko sai nhiều lắm-:
Tất cả các cái CCC mà các bác thấy hay ko thấy mà vẫn dùng -từ hiện tượng thiên nhiên đến thiết bị cụ thể- về cơ bản có thể được mô tả bằng toán học và cơ bản các dạng công thức, phương trình -equations, formula,...- tùy theo cách tiếp cận khác nhau là dạng phi tuyến bậc 2, 3,... -nonlinear- và vô nghiệm -vì ko có nguyên hàm-.
Như vậy pahir giải gần đúng và người ko bao giờ giải được.
Vậy phải giải bằng máy tính, mà máy tính thì nó chỉ nhận dạng nhị phân/binary và vậy ta phải đưa nó về hệ phương trình bậc nhất/tuyến tính.
Mà hệ này nó sẽ chuyển thành MATRIX cỡ lớn mà cũng chẳng phải dạng vuông, mà dạng bất kỳ, kiểu 1000x1852.....
Nên người thì thôi quên đi.
Đù,.., bây giờ thấy cái phim Matrix nó làm cũng có cơ sở.
-cond.....
Em xem nội dung thì đ.m. giống đến 70% cái mà em đã học và em rạc zái ra từ cáhc đây 20 năm, sau đó làm liên tục trong 5 năm nữa,... và cuối cùng ko làm được cái qué gì ra hồn, vác xác về quê làm thằng da đen...
-năm 2012-3 mức lương start cho thằng freshgraduate khoảng 70-90K/y; còn dạng có kinh nghiệm 4-5 năm thì ko dưới 150K/y, bonus này nọ chưa tính; thế mới đen chứ,.., mà còn chưa đen bằng cậu bạn em,...-
Từ điểm xuất phát củ chuối của em nó có nhiều tên gọi, mà em biết: scientific computing, simulation of continous system, computation of continum structure, data analysis and numerical methods in application on ...., nhưng tóm zái lại thì theo em biết nó là cái này -chắc ko sai nhiều lắm-:
Tất cả các cái CCC mà các bác thấy hay ko thấy mà vẫn dùng -từ hiện tượng thiên nhiên đến thiết bị cụ thể- về cơ bản có thể được mô tả bằng toán học và cơ bản các dạng công thức, phương trình -equations, formula,...- tùy theo cách tiếp cận khác nhau là dạng phi tuyến bậc 2, 3,... -nonlinear- và vô nghiệm -vì ko có nguyên hàm-.
Như vậy pahir giải gần đúng và người ko bao giờ giải được.
Vậy phải giải bằng máy tính, mà máy tính thì nó chỉ nhận dạng nhị phân/binary và vậy ta phải đưa nó về hệ phương trình bậc nhất/tuyến tính.
Mà hệ này nó sẽ chuyển thành MATRIX cỡ lớn mà cũng chẳng phải dạng vuông, mà dạng bất kỳ, kiểu 1000x1852.....
Nên người thì thôi quên đi.
Đù,.., bây giờ thấy cái phim Matrix nó làm cũng có cơ sở.
-cond.....
Đến bây giờ thì em chẳng còn đọc lại nữa,..., nhưng em cũng cứ liều mà phán là mấy cái tập hợp đám mây/cloud, ảo/fuzzy,.... , CCC gì cũng là tập hợp của các tổ hợp matrix thôi.
Các bác nên để ý là các matrix này các phần tử/element nó lung tung xòe, đôi khi chỉ sai khác đến phần mười triệu,.., và rất nhiều phần tử rỗng/empty,...
Vì vậy bài toán xử lý cái matrix này rất khó khăn, và dễ sai.
-về cái này các bác hình dung nôm là năm 2000-2001 gì đó google mới còn yếu nó có thuật toán search; sau đó yahoo rất nhiều tiền bỏ vào mà làm mấy năm ko ra thuahat toán tốt, toàn tính sai,..., nên đành thôi bỏ-
Và khi em ngập mặt vào cái này thì dân tình đã làm được 5-7 năm, hay lâu hơn thì em ko rõ, chủ yếu ở các lab lớn, về tính toán song song/parallel computing/programing mà sau đó hay được gọi bằng cái tên rất oai -high performance computing-.
Cái này nó là lập ttrinhf song song để cho các máy có nhiều hơn 1 processor -gọi là 1 node- chạy, thường là máy 2/4/8/16/24/32/64/128/... nodes chạy.
Những máy này rất đắt, vì mỗi 1 node cần 1 graphic cable có giá bằng cả 1 node để nối với nhau,..., nhất là ngaỳ xưa phần cứng còn rất đắt, mà tốc độ chậm nên ko được ứng dụng rộng rãi.
em nghi là 1 cái stationworks 8 nodes mà em làm khoảng 98-99 có khi chưa bằng cái điện thoại lởm bây giờ, vì tốc độ 1 node chỉ khoảng 512Kb. -tất nhiên ko thể quy chiếu riêng về tốc độ, vì khi em làm em làm thì data được sắp xếp rất gọn, nên chạy nhanh-
Vì thế mấy cái mà bọn em làm chỉ có ứng dụng cho big structures, massive system, complex deformation,.... và ứng dụng khá hẹp hoặc ko rộng.
Mấy cái phân mềm mô phỏng CAM, CAD,..., cũng được chuyển biến từ mấy cái phương trình cơ học: rắn + lỏng + ..., rồi dùng mấy phương pháp phổ biến FEM, BEM, stochastic, waves,... để rời rạc hóa/số hóa/discretion/numericalization để chuyển thành phần mềm built-in ready to use,... tất nhiên đó là sản phẩm của hàng ngàn người hạng nhất làm ra rồi.
Các bác nên để ý là các matrix này các phần tử/element nó lung tung xòe, đôi khi chỉ sai khác đến phần mười triệu,.., và rất nhiều phần tử rỗng/empty,...
Vì vậy bài toán xử lý cái matrix này rất khó khăn, và dễ sai.
-về cái này các bác hình dung nôm là năm 2000-2001 gì đó google mới còn yếu nó có thuật toán search; sau đó yahoo rất nhiều tiền bỏ vào mà làm mấy năm ko ra thuahat toán tốt, toàn tính sai,..., nên đành thôi bỏ-
Và khi em ngập mặt vào cái này thì dân tình đã làm được 5-7 năm, hay lâu hơn thì em ko rõ, chủ yếu ở các lab lớn, về tính toán song song/parallel computing/programing mà sau đó hay được gọi bằng cái tên rất oai -high performance computing-.
Cái này nó là lập ttrinhf song song để cho các máy có nhiều hơn 1 processor -gọi là 1 node- chạy, thường là máy 2/4/8/16/24/32/64/128/... nodes chạy.
Những máy này rất đắt, vì mỗi 1 node cần 1 graphic cable có giá bằng cả 1 node để nối với nhau,..., nhất là ngaỳ xưa phần cứng còn rất đắt, mà tốc độ chậm nên ko được ứng dụng rộng rãi.
em nghi là 1 cái stationworks 8 nodes mà em làm khoảng 98-99 có khi chưa bằng cái điện thoại lởm bây giờ, vì tốc độ 1 node chỉ khoảng 512Kb. -tất nhiên ko thể quy chiếu riêng về tốc độ, vì khi em làm em làm thì data được sắp xếp rất gọn, nên chạy nhanh-
Vì thế mấy cái mà bọn em làm chỉ có ứng dụng cho big structures, massive system, complex deformation,.... và ứng dụng khá hẹp hoặc ko rộng.
Mấy cái phân mềm mô phỏng CAM, CAD,..., cũng được chuyển biến từ mấy cái phương trình cơ học: rắn + lỏng + ..., rồi dùng mấy phương pháp phổ biến FEM, BEM, stochastic, waves,... để rời rạc hóa/số hóa/discretion/numericalization để chuyển thành phần mềm built-in ready to use,... tất nhiên đó là sản phẩm của hàng ngàn người hạng nhất làm ra rồi.
Do nó hẹp mà khá khó, vì mấy thằng làm cái này phải biết khá chắc về applied math, nắm vững về chuyên môn: vd: cho mechanics, electronics, bio, electrical,... và phải biết thêm về programing để làm thành chương trình cho máy chạy,....; mà lại thu nhập thấp, không có nhiều cơ hội mở mang kiếm tiền to,..., cho nên túm váy lại là đa phần bọn bản xứ giãy chết nó khinh không thèm làm.
Chủ yếu các chú Đông Âu cũ, Ấn, Tàu, Ả rập,... dưới chỉ đạo củ bọn da trắng thực dân đế quốc,...
Vậy trở về cái data science đời mới này thì em nghĩ là thế này: nó vẫn là các thuật toán khác nhau để phân loại, tách tầng/mức/cấp, định dạng nhóm,... của số liệu và xử lý các null-sub matrix nhưng luôn phải áp dụng thuật toán tối ưu hóa -optimization- trong điều kiện là dạng số liệu đầu vào -essential conditions- và điều kiện kèm theo/đầu ra cho từng cụm số liệu -boundary conditions- biến đổi liên tục...; để sao cho các main-frame/supercomputer chạy nhanh nhất và hiệu quả nhất.
Đây là dạng khó mà ngày xưa bọn em nhục lắm, dù ngay xưa bài toán được làm nhẹ đi nhiều, vì xếp hàng chờ vài ngày để chạy, mà chỉ cần vài cụm ma trận rỗng, có khoảng 10% các node nó chạy ko tải/idle là thằng quản trị nó đá lộn ra ngay, kèm theo cái tag là mày phạm vào lần nữa sẽ bị treo 1 lần queuing,...
Bẵng đi khoảng 6-7 năm, tầm 2010-11 phần cứng và ừng dụng song song handheld nó bùng nổ, ngành xủa lý số liệu ko kiếm được người, và lương cao vùn vụt, cơ hội kiếm tiền to nhiều..... nên bọn bản xứ nó lại quay lại làm thôi và nó hot được gọi là data sience...
Chủ yếu các chú Đông Âu cũ, Ấn, Tàu, Ả rập,... dưới chỉ đạo củ bọn da trắng thực dân đế quốc,...
Vậy trở về cái data science đời mới này thì em nghĩ là thế này: nó vẫn là các thuật toán khác nhau để phân loại, tách tầng/mức/cấp, định dạng nhóm,... của số liệu và xử lý các null-sub matrix nhưng luôn phải áp dụng thuật toán tối ưu hóa -optimization- trong điều kiện là dạng số liệu đầu vào -essential conditions- và điều kiện kèm theo/đầu ra cho từng cụm số liệu -boundary conditions- biến đổi liên tục...; để sao cho các main-frame/supercomputer chạy nhanh nhất và hiệu quả nhất.
Đây là dạng khó mà ngày xưa bọn em nhục lắm, dù ngay xưa bài toán được làm nhẹ đi nhiều, vì xếp hàng chờ vài ngày để chạy, mà chỉ cần vài cụm ma trận rỗng, có khoảng 10% các node nó chạy ko tải/idle là thằng quản trị nó đá lộn ra ngay, kèm theo cái tag là mày phạm vào lần nữa sẽ bị treo 1 lần queuing,...
Bẵng đi khoảng 6-7 năm, tầm 2010-11 phần cứng và ừng dụng song song handheld nó bùng nổ, ngành xủa lý số liệu ko kiếm được người, và lương cao vùn vụt, cơ hội kiếm tiền to nhiều..... nên bọn bản xứ nó lại quay lại làm thôi và nó hot được gọi là data sience...