Lờ... đờ :-D
18/9/04
3.594
95.529
113
@hanoiman: Hề hề! Tôi đố kỵ mà nói vậy thôi mà! :D
Thực ra cách tiếp cận ban đầu của GG là phi chuẩn vì chú trọng đến việc "tầm chương, trích cú" chứ không giúp người đọc có được một cái nhìn tổng thể về phổ tài liệu mình đang tìm kiếm. Vì thế, thực ra đối với giới học thuật cách tìm thông tin của GG không hề được coi trọng. Nhưng hai đồng chí sáng lập GG đã nhìn thấy được sự bùng nổ của Internet và đánh giá được rằng giới học thuật sẽ chỉ là thiểu số trong cộng đồng người dùng Internet. Và GG đã ưu tiên phục vụ nhóm này. Chìa khóa thành công của GG chính là thuật toán phân loại, đánh giá, xếp hạng dữ liệu để tự động chọn ra tài liệu phù hợp nhất với yêu cầu trong một mớ tài liệu hổ lốn trên Internet. Mặc dù giới học thuật rất cay cú với cách làm này nhưng vì lượng dữ liệu cần tìm kiếm quá lớn, vượt quá khả năng phân loại của hệ thống biên mục hiện có nên đành tặc lưỡi thỏa hiệp. GG sau khi có được vị trí độc tôn cũng quay trở lại tinh chỉnh thuật toán của mình nhằm phục vụ những dạng đối tượng chuyên biệt hơn bằng những CSDL mà có khi nhiều bác ở đây không hề biết. Ví dụ:
- Google Patents tại địa chỉ google.com/patents chứa gần như đầy đủ các đơn sáng chế của Mỹ từ cuối thể kỷ XIX đến nay.
- Google Scholar tại địa chỉ google.com/scholar chứa các bài viết mang tính nghiên cứu, học thuật
- Google Books tại địa chỉ google.com/books chứa rất nhiều sách được số hóa
Tất cả CSDL này đều sử dụng thế mạnh của Google trong việc tìm kiếm để giúp người dùng lục lọi trong đống tài liệu này.

Tuy nhiên, có một ngộ nhận mà rất nhiều người mắc phải khi cho rằng "Đã có Google thì không cần thư viện nữa!!!" Đây là một nhầm lẫn to lớn nhưng để phân tích rõ thì cần viết dài lắm mà tôi thì lại lười! :D
 
Hạng C
21/1/12
591
5.200
93
có cách nào lưu sách từ Google Books về máy mình ko nhỉ?
 
Hạng D
16/1/13
4.804
87.243
113
Cách tìm trên thư viện rất hay và chính xác nhưng cần có một kỹ năng nhất định. Kỹ năng này phải được học và thấm từ từ thông qua các lớp học research.

Do đó không có ai đập phá thư viện cả mà ngày một xây thêm.
 
Lờ... đờ :-D
18/9/04
3.594
95.529
113
có cách nào lưu sách từ Google Books về máy mình ko nhỉ?
Có nhưng hơi khó và thường là không đầy đủ vì Google không đưa toàn bộ nội dung sách lên mạng bác ạ! Do đó cách phổ biến là dùng Google lục xem có trang nào chia sẻ quyển đó miễn phí hay không thôi.
 
Hạng B2
18/10/09
364
81
63
37
Hà Nội
@hanoiman: Hề hề! Tôi đố kỵ mà nói vậy thôi mà! :D
Thực ra cách tiếp cận ban đầu của GG là phi chuẩn vì chú trọng đến việc "tầm chương, trích cú" chứ không giúp người đọc có được một cái nhìn tổng thể về phổ tài liệu mình đang tìm kiếm. Vì thế, thực ra đối với giới học thuật cách tìm thông tin của GG không hề được coi trọng. Nhưng hai đồng chí sáng lập GG đã nhìn thấy được sự bùng nổ của Internet và đánh giá được rằng giới học thuật sẽ chỉ là thiểu số trong cộng đồng người dùng Internet. Và GG đã ưu tiên phục vụ nhóm này. Chìa khóa thành công của GG chính là thuật toán phân loại, đánh giá, xếp hạng dữ liệu để tự động chọn ra tài liệu phù hợp nhất với yêu cầu trong một mớ tài liệu hổ lốn trên Internet. Mặc dù giới học thuật rất cay cú với cách làm này nhưng vì lượng dữ liệu cần tìm kiếm quá lớn, vượt quá khả năng phân loại của hệ thống biên mục hiện có nên đành tặc lưỡi thỏa hiệp. GG sau khi có được vị trí độc tôn cũng quay trở lại tinh chỉnh thuật toán của mình nhằm phục vụ những dạng đối tượng chuyên biệt hơn bằng những CSDL mà có khi nhiều bác ở đây không hề biết. Ví dụ:
- Google Patents tại địa chỉ google.com/patents chứa gần như đầy đủ các đơn sáng chế của Mỹ từ cuối thể kỷ XIX đến nay.
- Google Scholar tại địa chỉ google.com/scholar chứa các bài viết mang tính nghiên cứu, học thuật
- Google Books tại địa chỉ google.com/books chứa rất nhiều sách được số hóa
Tất cả CSDL này đều sử dụng thế mạnh của Google trong việc tìm kiếm để giúp người dùng lục lọi trong đống tài liệu này.

Tuy nhiên, có một ngộ nhận mà rất nhiều người mắc phải khi cho rằng "Đã có Google thì không cần thư viện nữa!!!" Đây là một nhầm lẫn to lớn nhưng để phân tích rõ thì cần viết dài lắm mà tôi thì lại lười! :D


chuẩn, thì ở comment trên em có nói, search là 1 chuyện mà tinh ý để lọc thông tin hay ko là 1 chuyện khác, GG chỉ là cái máy, mục đích giúp mọi người tìm thông tin thôi, còn ăn thua là những trang được GG trả về ấy, đó mới ăn tiền :p
 
Hạng B2
18/10/09
364
81
63
37
Hà Nội
VD tìm 1 phần mềm trên mạng mà bị đặt pass giải nén, trang share ko có thì em thường chơi nguyên kiểu "link trang download" là ra 1 đống site khác cũng share link đó, gặp may thì gặp trang gốc, có cho pass giải nén luôn :D
 
Lờ... đờ :-D
18/9/04
3.594
95.529
113
Quay lai chủ đề là mẹo tìm kiếm bằng Google thì để giới hạn phạm vi tìm kiếm của Google có thể sử dụng một số toán tử sau:
1. Site: để giới hạn vùng tên miền tìm kiếm Ví dụ: site: .otosaigon.com hay site:.vn
2. Filetype: để giới hạn việc tìm kiếm bên trong một loại tập tin nào đó Ví dụ: filetype: .pdf hay filetype:doc,docx,xls

Ngoài ra GG còn hỗ trợ các cách tìm kiếm dùng ký tự đại diện (wildcard), từ đồng nghĩa v.v... nhưng hỗ trợ chủ yếu cho tiếng Anh chứ tiếng Việt mới chỉ đoán được từ không dấu và phát hiện cụm từ (nhưng như vậy đã là tốt lắm rồi). Nếu bác nào cầu kỳ hơn thì có thể xây dựng câu lệnh tìm kiếm với các toán tử luận lý như AND, OR, NOT nhưng như thế có vẻ đánh đố nhau quá nhỉ!? :D
 
Hạng D
21/10/08
3.652
74.753
113
Miền Không Xác Định
VD tìm 1 phần mềm trên mạng mà bị đặt pass giải nén, trang share ko có thì em thường chơi nguyên kiểu "link trang download" là ra 1 đống site khác cũng share link đó, gặp may thì gặp trang gốc, có cho pass giải nén luôn :D
1 số phần mềm em tìm key qua youtube và dailymotion mới ghê :D
 
Hạng B1
25/8/14
58
24
18
53
Bác tuandq cho em hỏi:
1) số lượng server của Gôgle : làm sao nó dữ được bí mật, nếu bọn đối thủ muốn biết có rất nhiều cách, coi giá trị tai sản khi ipo là 1 ví dụ. Ngoài ra như coi lượng điện năng tiêu thụ hoặc ngay cả chơi xấu tình báo. Nếu số lượng server là sống còn thì lại càng không có gì là không thể. Nhất là trong thời đại Internet hiện nay, có thể tìm được bản vẽ của cả nhà trắng.

2) bì quyết của Gôgle là bí mật? Bí mật về thuật toán search engine, bí mật về lưu trữ (nó lưu cả Gôgle map, book...) nếu chỉ những người sáng lập biết và lưu giữ thì thật nguy hiểm. Những người này tèo thì Gôgle cũng tèo à. Vậy thì ai dám đầu tư vào cp Gôgle nữa. Nếu thuật toán này có thể lộ ra được (em thiên về điều này vì em cho rằng không gì là không thể) thì sao yahoo hay bing hay ask không copy?

3) cuối cùng em rất phục Gôgle ở khả năng lưu trữ của nó. Khi mới ra nó đã cho gmail free 2gb trong khi yahoo lúc đó chỉ 250mb. Rồi lưu trữ Gôgle map (vệ tinh chụp ảnh khắp thế giới) nói tóm lại là nó đã thực hiện câu "không có j là không thể". Câu hỏi của em là làm sao nó quản lý tốt dữ liệu trong điều kiện cứ mỗi phút có cả ngàn hoặc thậm chí trăm ngàn truy cập dữ liệu (Cty em xài con ibm as400 khỏang hơn chục user vào cùng lúc là thấy nó không ổn rồi)
 
Hạng D
12/9/11
1.115
25.784
113
Bác Newbiecho cho e hỏi làm sao Google có thể cho ra kết quả quá nhanh như vậy trong vũ trụ thông tin, trong khi search kiếm một cái file trên pc cũng mất cả phút. Khó hiểu thật.
E cám ơn bác chủ vì thớt bổ ích.
Bác tham khảo 1 vài hình ảnh về hệ thống làm mát (cooling system) cho server của google tại một phòng máy (nó có hàng trăm cái như thế khắp thế giới) để hình dung ra hệ thống của nó to như thế nào nè.
insidegoogledatacenters-2.jpg

google-datacenter-tech-14-640x426.jpg

Nhìn giống nhà máy nước Thủ Đức hén bác.
memory_opener_0.jpg
 
Chỉnh sửa cuối: