Bác Thanh chuẩn xác rồi, 1 người vừa có kinh nghiệm trong ngành vừa biết sử dụng ML sẽ tuyệt vời.Big data - Machine learning - Marketing automation theo em là những công cụ tốt để hỗ trợ phân tích và khai thác. Yếu tố key vẫn là con người product marketing hiểu về doanh nghiệp về thị trường và hiểu ý đồ ban điều hành cộng thêm sense (độ nhạy thị trường) ra quyết định cuối cùng. Máy giúp người nhiều và tiêu nhiều tiền khi hiểu sai ra quyết định sai thì máy hại lắm.
Bác @We và các bác, theo như bác We có gợi ý thì em thử làm nhanh với 2 model khác xem sao.
Ở lần chạy model XGBoost em thấy chủ yếu Input có Numerical có tác động mạnh đến Output nên em thử chỉ lấy các Input có Numerical để chạy model DecisionTreeClassifier xem sao thì kết quả ra rất tệ
Tiếp theo em lấy thêm Input Job vào model và chạy model RandomForestClassifier thì kết quả có cải tiến hơn nhưng vẫn ko bằng XGBoost
Em nghĩ em sẽ chạy Neuron Network và lấy tất cả các Input bao gồm cả Numerical và Categorical vào xem kết quả thế nào.
Ở lần chạy model XGBoost em thấy chủ yếu Input có Numerical có tác động mạnh đến Output nên em thử chỉ lấy các Input có Numerical để chạy model DecisionTreeClassifier xem sao thì kết quả ra rất tệ
Tiếp theo em lấy thêm Input Job vào model và chạy model RandomForestClassifier thì kết quả có cải tiến hơn nhưng vẫn ko bằng XGBoost
Em nghĩ em sẽ chạy Neuron Network và lấy tất cả các Input bao gồm cả Numerical và Categorical vào xem kết quả thế nào.
Attachments
-
7,8 KB Đọc: 11
-
4,4 KB Đọc: 8
Thấy anh có nhiều chia sẻ về ML. Anh đang làm về nghề gì vậy?Em xin giới thiệu chủ đề này để khi bác nào có làm về Marketing in Banking có thể tham khảo, chủ đề này đã được cộng đồng ML viết nhiều, em tổng hợp lại và em để đường link cho các bác tham khảo.
https://github.com/topics/bank-marketing-analysis
Đề bài đặt ra là Team của bạn đang cần huy động vốn từ các Khách hàng cá nhân.
Chúng ta có bảng dữ liệu thô từ chiến dịch “Huy động vốn” lần trước như sau:
View attachment 1851863 Bảng dữ liệu này có hơn 11.000 dòng, và 14 cột như trên, tương ứng với việc ta có hơn 11000 khách hàng.
Thông tin từ bảng dữ liệu ta biết được, Tuổi, Nghề nghiệp, Số dư tài khoản, có đang vay tiền Mua nhà hay vay cá nhân ko, và người đó có đang gửi tiết kiệm hay ko. Mục tiêu của chúng ta là tìm ra những yếu tố trên, yếu tố nào quan trọng trong việc quyết định người đó có gửi tiết kiệm hay ko thông qua cột Deposit là "yes" hay "no"
Khảo sát ban đầu từ bảng dữ liệu ta thấy người làm trong ngành Dịch vụ, Công nhân thường có xu hướng ko gửi tiết kiệm. Trong khi những người đã Nghỉ hưu thường có xu hướng gửi tiết kiệm cao nhất.
Tình trạng hôn nhân cung có phần ảnh hưởng đến việc người đó có xu hướng gửi tiết kiêm hay ko, thì với những người độc thân hay đã ly dị thường có xu hướng gửi tiết kiêm cao hơn những cặp vợ chồng.
View attachment 1851864 View attachment 1851865
Mục tiêu là ta tìm được 1 model đi qua các đặc điểm trong bang dữ liệu và dự báo được là người đó có Gửi tiết kiệm hay ko.
Và từ đó rút ra được đặc điểm nào sẽ mang tính chat quyết định quan trọng nhất.
Khi đã xử lý dữ liệu thô và chạy ra model thì ta rút ra dc các đặc điểm quan trọng sau:
View attachment 1851866
.
Từ kết quả model ta có được thông tin Số dư tài khoản và tuổi của khách hàng là 2 yếu tố quyết định
Như vậy để xác suất trên 50% Khách hang sẽ chap nhận gửi tiết kiệm thì:
Số dư tài khoản của Khách hang nên từ 1490usd trở lên.
Độ Tuổi dưới 31 tuổi, hoặc trên 56 tuổi.
Ngoài ra số cuộc gọi đến Khách hàng dưới 4 cuộc gọi, vì từ 5 cuộc gọi trở lên thì Khách hang thường có xu hướng từ chối gửi tiết kiệm.
Như vậy công việc của Team sẽ thuận lợi hơn khi tiếp thị chiến dịch "Huy động vốn" tập trung cho những Khách hàng có đặc điểm trên.
Đây là kết quả rút ra được từ data đã được Public trên mạng và ở 1 bank nào đó của nước ngoài. Nếu ở Việt Nam và có data thì kết quả phân tích của chúng ta sẽ ra khác nhưng con đường phân tích thì tương tự.
Em chia sẻ để em nhận lại của những bác đi trước, và làm như vậy để mình có tương tác thì việc học sẽ nhanh hơn.Thấy anh có nhiều chia sẻ về ML. Anh đang làm về nghề gì vậy?
Em xin giới thiệu chủ đề này để khi bác nào có làm về Marketing in Banking có thể tham khảo, chủ đề này đã được cộng đồng ML viết nhiều, em tổng hợp lại và em để đường link cho các bác tham khảo.
https://github.com/topics/bank-marketing-analysis
Đề bài đặt ra là Team của bạn đang cần huy động vốn từ các Khách hàng cá nhân.
Chúng ta có bảng dữ liệu thô từ chiến dịch “Huy động vốn” lần trước như sau:
View attachment 1851863 Bảng dữ liệu này có hơn 11.000 dòng, và 14 cột như trên, tương ứng với việc ta có hơn 11000 khách hàng.
Thông tin từ bảng dữ liệu ta biết được, Tuổi, Nghề nghiệp, Số dư tài khoản, có đang vay tiền Mua nhà hay vay cá nhân ko, và người đó có đang gửi tiết kiệm hay ko. Mục tiêu của chúng ta là tìm ra những yếu tố trên, yếu tố nào quan trọng trong việc quyết định người đó có gửi tiết kiệm hay ko thông qua cột Deposit là "yes" hay "no"
Khảo sát ban đầu từ bảng dữ liệu ta thấy người làm trong ngành Dịch vụ, Công nhân thường có xu hướng ko gửi tiết kiệm. Trong khi những người đã Nghỉ hưu thường có xu hướng gửi tiết kiệm cao nhất.
Tình trạng hôn nhân cung có phần ảnh hưởng đến việc người đó có xu hướng gửi tiết kiêm hay ko, thì với những người độc thân hay đã ly dị thường có xu hướng gửi tiết kiêm cao hơn những cặp vợ chồng.
View attachment 1851864 View attachment 1851865
Mục tiêu là ta tìm được 1 model đi qua các đặc điểm trong bang dữ liệu và dự báo được là người đó có Gửi tiết kiệm hay ko.
Và từ đó rút ra được đặc điểm nào sẽ mang tính chat quyết định quan trọng nhất.
Khi đã xử lý dữ liệu thô và chạy ra model thì ta rút ra dc các đặc điểm quan trọng sau:
View attachment 1851866
.
Từ kết quả model ta có được thông tin Số dư tài khoản và tuổi của khách hàng là 2 yếu tố quyết định
Như vậy để xác suất trên 50% Khách hang sẽ chap nhận gửi tiết kiệm thì:
Số dư tài khoản của Khách hang nên từ 1490usd trở lên.
Độ Tuổi dưới 31 tuổi, hoặc trên 56 tuổi.
Ngoài ra số cuộc gọi đến Khách hàng dưới 4 cuộc gọi, vì từ 5 cuộc gọi trở lên thì Khách hang thường có xu hướng từ chối gửi tiết kiệm.
Như vậy công việc của Team sẽ thuận lợi hơn khi tiếp thị chiến dịch "Huy động vốn" tập trung cho những Khách hàng có đặc điểm trên.
Đây là kết quả rút ra được từ data đã được Public trên mạng và ở 1 bank nào đó của nước ngoài. Nếu ở Việt Nam và có data thì kết quả phân tích của chúng ta sẽ ra khác nhưng con đường phân tích thì tương tự.
7 nghể học cái này được không anh? Có cần điều kiện gì không?
Bao nhiêu là tri thức cho anh em 7 nghiệp CNL
Toàn học chưa hết lớp 8 nên hông hiểu gì đâu anh.
Học dc hết bác, em cũng đi từ con số 0. Em tốt nghiệp ngành cơ khí và tài chính, ko có kiến thức gì về lập trình nhưng cứ đi thì hy vọng sẽ tới.7 nghể học cái này được không anh? Có cần điều kiện gì không?
Ko có kiến thức lập trình mà code khiếp vậy ?Học dc hết bác, em cũng đi từ con số 0. Em tốt nghiệp ngành cơ khí và tài chính, ko có kiến thức gì về lập trình nhưng cứ đi thì hy vọng sẽ tới.
Vẫn chỉ là amatuer, em đang cố gắng thêm.Ko có kiến thức lập trình mà code khiếp vậy ?