Em cũng ko rành về định nghĩa, chỉ đoán là data science nó ở cấp độ cao hơn.Mà e nghe bảo data analysis và data science khác nhau thì phải
Em đọc chơi cho đỡ tụt hậu mà thấy mình đã quên hết kiến thức toán xstk
Attachments
-
114,8 KB Đọc: 17
Nó đó anh. Hồi xưa SPSS đã làm đc nhưng vất vả hơn.Bác đang muốn làm gì vậy?
Em đọc thấy giống xác suất thống kê quá
Áp dụng ML cho bài toán chẩn đoán hư hỏng (Ck), chẩn đoán bệnh tim qua tín hiệu ECG,....
Bữa giờ cũng lê lết đọc 1 số article,
thấy bài này có vẻ chính xác.
https://machinelearningmastery.com/machine-learning-tribe/
Cái chính là chúng ta quan tâm tới ML ở góc nhìn nào để có những concern như thế nào.
Theo bài viết này có lẽ mình thuộc nhóm 7,8 ...
Hình hoa đâu?Trong lúc em chờ training dữ liệu cho bài toán đang giải quyết thì em thử nghiêm với 1 bài toán nhỏ về phân loại hoa Iris bằng phương pháp RandomForestClassifier để xem R_squared của model thế nào, thì thấy kết quả của bài toán nhỏ này rất tốt.
View attachment 1853634
Em vừa chạy clean lại dữ liệu và chạy thử thì thấy chưa tốt, nhờ bác We và các bác nghía qua bảng kết quả và cho em nhận xét nhé.Anh lỡ rồi thì up luôn toàn bộ mấy cái chỉ số thống kê của từng model mình nghía cái được không? Chứ nhìn R2 thì thể hiện model không thực tế. Có thể data này không real. Hoặc model bị drive bởi 1 biến nào đó cần loại trừ.
Attachments
-
21,9 KB Đọc: 13
Tỷ lệ test /training là bao nhiêu ?Trong lúc em chờ training dữ liệu cho bài toán đang giải quyết thì em thử nghiêm với 1 bài toán nhỏ về phân loại hoa Iris bằng phương pháp RandomForestClassifier để xem R_squared của model thế nào, thì thấy kết quả của bài toán nhỏ này rất tốt.
View attachment 1853634
dùng R quá sâu, quá kỹ thuật và với mô hình thực tế thì không dễ để code đâu, cái này dành cho mấy bạn kỹ thuật.
Hướng tới dùng tool để sử dụng, vận hành linh hoạt và quan trọng là giải quyết được bài toán thực tế của ngân hàng hoặc doanh nghiệp thì mới là cái nên làm.
Là 30/70 đó bác, mà em nhận thấy R_squared của nó tốt cũng phần lớn là do inputs nó dễ đoán labels quá, có khi mình nhìn mắt cũng đoán dc.Tỷ lệ test /training là bao nhiêu ?