Một số lưu ý mà người sử dụng cần biết khi tìm kiếm thông tin là gì

Bài tập và thực hành 11: Thư điện tử và máy tìm kiếm thông tin – Câu 3 trang 162 SGK Tin học 10. Máy tìm kiếm là gì? Máy tìm kiếm có thể tìm được bất kì thông tin nào ta quan tâm không?

Máy tìm kiếm là gì? Máy tìm kiếm có thể tìm được bất kì thông tin nào ta quan tâm không?

Máy tìm kiếm là một hệ thống cho phép tìm kiếm các thông tin trên Internet yêu cầu của người dùng.

Máy tìm kiếm chỉ tìm kiếm được với các thông tin ta quan tâm với các điều kiện sau:

– Thông tin đã được lưu trữ trên website nào đó trên mạng;

Quảng cáo

– Máy tìm kiếm có quyền truy cập và có khả năng truy cập tới các website đó;

– Yêu cầu của người dùng đủ chính xác để tìm kiếm thông tin.

Máy tìm kiếm không thể tìm kiếm mọi thông tin mà ta quan tâm. Bởi vì dựa vào các điều kiện đã nêu ở trên thì chỉ một vài thông tin chưa đưa lên mạng, người sử dụng không thể tìm kiếm được những thông tin đó băng các máy tìm kiếm được.

Google lấy thông tin từ nhiều nguồn, bao gồm:

  • Các trang web
  • Nội dung do người dùng gửi, chẳng hạn như Trang doanh nghiệp của bạn và nội dung người dùng gửi trên Google Maps
  • Nội dung quét từ sách
  • Các cơ sở dữ liệu công khai trên Internet
  • Nhiều nguồn khác

Tuy nhiên, trang này tập trung vào nguồn thông tin là các trang web. Google thực hiện ba bước cơ bản để tạo kết quả từ các trang web:

  • Thu thập dữ liệu
  • Lập chỉ mục
  • Phân phát [và xếp hạng]

Thu thập dữ liệu

Bước đầu tiên là tìm những trang tồn tại trên web. Do không tồn tại một danh mục trung tâm về mọi trang web, Google phải liên tục tìm những trang mới và thêm những trang đó vào danh sách các trang đã biết. Google biết đến một số trang vì chúng tôi từng truy cập những trang đó. Google tìm thấy các trang khác khi đi theo đường liên kết từ một trang đã biết đến một trang mới. Ngoài ra, chúng tôi cũng phát hiện một số trang khác khi chủ sở hữu trang web gửi danh sách các trang [sơ đồ trang web] để Google thu thập dữ liệu. Nếu bạn đang sử dụng một nhà cung cấp dịch vụ lưu trữ web có người quản lý [chẳng hạn như Wix hoặc Blogger], thì họ có thể yêu cầu Google thu thập dữ liệu mọi trang bạn mới tạo hoặc cập nhật.

Khi phát hiện ra URL của một trang, Google sẽ truy cập hoặc thu thập dữ liệu trang đó để tìm hiểu nội dung trên trang. Google hiển thị trang và phân tích cả nội dung văn bản lẫn nội dung không phải văn bản cũng như bố cục trực quan tổng thể để quyết định vị trí mà trang có thể xuất hiện trong kết quả của Google Tìm kiếm. Càng hiểu rõ về trang web của bạn thì Google càng có thể hiển thị trang cho những người phù hợp, đang tìm kiếm nội dung của bạn.

Cách cải thiện kết quả thu thập dữ liệu trang web:

  • Xác minh rằng Google có thể truy cập các trang trên trang web của bạn và những trang đó hiển thị đúng cách. Google truy cập các trang web dưới dạng người dùng ẩn danh [người dùng không có mật khẩu hoặc thông tin]. Google phải có khả năng xem tất cả hình ảnh và các phần tử khác của trang để có thể hiểu đúng nội dung trên trang. Bạn có thể kiểm tra nhanh bằng cách nhập URL của trang vào Công cụ kiểm tra tính thân thiện với thiết bị di động.
  • Nếu đã tạo hoặc cập nhật một trang, bạn có thể gửi một URL riêng lẻ cho Google. Để thông báo cùng lúc cho Google về nhiều trang mới tạo hoặc mới cập nhật, hãy sử dụng sơ đồ trang web.
  • Nếu bạn yêu cầu Google chỉ thu thập dữ liệu một trang, hãy chỉ định trang đó làm trang chủ của bạn. Đối với Google, trang chủ là trang quan trọng nhất trên trang web của bạn. Để giúp Google thu thập dữ liệu toàn bộ trang web, hãy đảm bảo rằng trang chủ [và mọi trang khác] đều có một hệ thống điều hướng rõ ràng liên kết đến mọi phần và trang quan trọng trên trang web của bạn. Hệ thống này giúp người dùng [và Google] dễ dàng di chuyển trong trang web của bạn. Đối với các trang web nhỏ hơn [dưới 1.000 trang], bạn chỉ cần cho Google biết trang chủ, miễn là Google có thể truy cập tất cả các trang khác bằng cách đi theo đường liên kết bắt nguồn từ trang chủ.
  • Liên kết một trang khác mà Google đã biết đến trang của bạn. Tuy nhiên, xin lưu ý rằng Google sẽ không truy cập các đường liên kết trong quảng cáo, đường liên kết mà bạn trả tiền trong các trang web khác, đường liên kết trong phần nhận xét hoặc các đường liên kết khác không tuân theo Nguyên tắc quản trị trang web của Google.
Google không nhận tiền để thu thập dữ liệu thường xuyên hơn hoặc xếp hạng cao hơn cho một trang web. Nếu ai đó nói khác thì họ đã nhầm.

Lập chỉ mục

Sau khi tìm thấy một trang, Google sẽ cố gắng tìm hiểu nội dung của trang đó. Quá trình này gọi là lập chỉ mục. Google phân tích nội dung của trang, lập danh mục hình ảnh và tệp video nhúng trên trang và cố gắng tìm hiểu trang theo cách khác. Thông tin này được lưu trữ trong chỉ mục của Google – một cơ sở dữ liệu khổng lồ lưu trữ trong rất nhiều máy tính.

Cách cải thiện kết quả lập chỉ mục cho trang:

  • Tạo tiêu đề trang ngắn gọn và ý nghĩa.
  • Sử dụng tiêu đề trang để truyền đạt chủ đề của trang.
  • Sử dụng văn bản thay vì hình ảnh để truyền đạt nội dung. Google có thể hiểu một số hình ảnh và video, nhưng không hiểu rõ như đối với văn bản. Ở mức tối thiểu, hãy chú thích video và hình ảnh của bạn bằng văn bản thay thế và các thuộc tính thích hợp khác.

Phân phát [và xếp hạng]

Khi người dùng nhập một cụm từ tìm kiếm, Google sẽ cố gắng tìm câu trả lời phù hợp nhất trong chỉ mục của chúng tôi dựa trên nhiều yếu tố. Google cố gắng xác định những câu trả lời có chất lượng cao nhất và xem xét những yếu tố sẽ cung cấp trải nghiệm người dùng tốt nhất và câu trả lời phù hợp nhất, như vị trí, ngôn ngữ và thiết bị của người dùng [máy tính hay điện thoại]. Ví dụ: dù cùng tìm kiếm "cửa hàng sửa xe đạp" nhưng người dùng ở Paris và người dùng ở Hong Kong sẽ nhận được những câu trả lời khác nhau. Google không nhận tiền để xếp hạng các trang cao hơn và quy trình xếp hạng được thực hiện theo chế độ lập trình.

Cách cải thiện hoạt động phân phát và xếp hạng của bạn:

Bản mô tả chi tiết hơn nữa

Bạn muốn biết thêm thông tin chuyên sâu về cách thức hoạt động của Tìm kiếm? Hãy đọc Hướng dẫn nâng cao về cách thức hoạt động của Google Tìm kiếm.

Except as otherwise noted, the content of this page is licensed under the Creative Commons Attribution 4.0 License, and code samples are licensed under the Apache 2.0 License. For details, see the Google Developers Site Policies. Java is a registered trademark of Oracle and/or its affiliates.

Last updated 2022-03-04 UTC.

[{ "type": "thumb-down", "id": "missingTheInformationINeed", "label":"Missing the information I need" },{ "type": "thumb-down", "id": "tooComplicatedTooManySteps", "label":"Too complicated / too many steps" },{ "type": "thumb-down", "id": "outOfDate", "label":"Out of date" },{ "type": "thumb-down", "id": "translationIssue", "label":"Translation issue" },{ "type": "thumb-down", "id": "samplesCodeIssue", "label":"Samples / code issue" },{ "type": "thumb-down", "id": "otherDown", "label":"Other" }] [{ "type": "thumb-up", "id": "easyToUnderstand", "label":"Easy to understand" },{ "type": "thumb-up", "id": "solvedMyProblem", "label":"Solved my problem" },{ "type": "thumb-up", "id": "otherUp", "label":"Other" }]

Bạn có biết Internet là kho kiến thức của nhân loại? Trên Internet bạn có thể tìm được vô số thông tin bổ ích và các kiến thức về mọi lĩnh vực từ khoa học cho đến lịch sử, văn học… Chính vì thế phương pháp tìm kiếm thông tin trên Internet được xem là một kỹ năng vô cùng quan trọng.

Bạn hãy tưởng tượng trước 1 kho thông tin như thế mà bạn chưa có mục đích tìm kiếm rõ ràng thì bạn sẽ vô cùng mất thời gian thậm chí bão hòa kiến thức vì lượng thông tin “nạp” vào trí nhớ quá nhiều. Sau đây, Hiếu Học sẽ trình bày một số phương pháp mà Hiếu Học tổng hợp được để giúp các bạn có thế tìm kiếm thông tin một cách nhanh chóng và hiệu quả.

Các bước chuẩn bị trước khi bắt đầu dùng Internet tìm kiếm

– Thu hẹp chủ đề, chọn những từ quan trọng, những mục quan trọng. Kết quả thông tin nhận được thường rất lớn nên gây mất tập trung cho sự chọn lựa bằng cách thu hẹp chủ đề, bạn sẽ tìm kiếm thông tin theo chiều sâu. Những thông tin này có thể ít hơn nhưng sẽ sát với chủ đề mà bạn muốn tìm.

– Nhờ sự giúp đỡ của bạn bè hay những người trợ giúp nghiên cứu trong các thư viện.

– Liệt kê những trang web nổi tiếng, có các đánh giá, chọn lọc…

– Ghi vào sổ tay các địa chỉ trang web chuyên về chủ điểm đang cần nghiên cứu có thể mục lục, tuyển tập liệt kê theo chủ đề…

– Nhẩm lại những từ khóa hay chủ đề quan trọng trong đầu để sử dụng nó trên công cụ tìm kiếm.

Sử dụng công cụ, chức năng tìm kiếm [search engine]

Sự ra đời các công cụ dò tìm là rất hữu ích cho người dùng Internet. Các trang này được ví như “danh bạ” để tìm địa chỉ, tên người, nội dung trang…nói chung tìm mọi thứ mà các trang web khác đưa lên hoặc tự nó tìm đến.

Bạn nên sử dụng nhiều công cụ tìm kiếm khác nhau. Mỗi công cụ tìm kiếm có một dữ liệu khác nhau về danh sách các trang web. Một vài công cụ tìm kiếm cỡ lớn còn tìm ra luôn cả những công cụ tìm kiếm nhỏ khác. Kết quả tìm đối với trang này có thể ít, nhưng trang khác thì rất phong phú hoặc ngược lại. Do đó, bạn nên dùng nhiều trang tìm kiếm khác nhau để tìm cùng một vấn đề mới có hiệu quả. Tất nhiên, bạn sẽ mất nhiều thời gian hơn. Vậy, kiên nhẫn  là yếu tố giúp bạn sở hữu được thông tin cần thiết.

Các trang web có công cụ dò tìm nổi tiếng hiện nay là: google.com, yahoo.com…[nổi tiếng toàn thế giới] hay monava.vn, xalo.vn, zing.vn, bamboo.vn… [ở Việt Nam].

1. Những bước cơ bản để tìm kiếm:

Sau khi gõ từ khóa vào và tìm kiếm thì một loạt kết quả sẽ hiển ra. Mỗi kết quả là một đường link đến trang web có chứa từ khóa hoặc chủ đề mà bạn đang muốn tìm. Việc bạn cần làm lúc này là xem xét kết quả mà chức năng tìm kiếm đưa ra:

– Nếu có quá nhiều kết quả, quay lại và gõ thêm từ vào ô tìm kiếm.

– Nếu có quá ít kết quả, thu hẹp/ xóa bớt một số từ trong ô tìm kiếm hoặc tìm từ khác thay thế.

– Bạn cũng nên thử xem qua những kết quả đầu tiên. Nếu những trang đó chưa hữu ích lắm, thử quay lại và dùng từ tìm kiếm khác

2. Để tìm kiếm một cách chi tiết hơn nữa thì bạn hãy sử dụng mục tìm kiếm nâng cao của chức năng tìm kiếm. Các kiểu tìm có thể dựa vào:

– Kết hợp các từ khóa, bao gồm cả chuỗi Boolean tức là các từ: AND [VÀ], OR [HOẶC], NOT[KHÔNG]. Ở đây Hiếu Học xin nói rõ thêm về ý nghĩa từ khóa: Từ khóa là một từ hoặc cụm từ được rút trong tên chủ đề hoặc chính văn tài liệu, nó phản ánh một phần nội dung hoặc toàn bộ nội dung của chủ đề hoặc tài liệu đó. Ví dụ bạn đang muốn tìm tài liệu để luyện thi đại học thì từ khóa ở đây là “luyện thi đại học” hay cụ thể hơn [để cho ra kết quả chính xác hơn] là “tài liệu thi đại học”, bạn có thể chọn từ hay cụm từ đồng nghĩa như với từ khóa đó như “ôn thi đại học”.

– Chỗ mà các từ khóa được tìm thấy. Ví dụ: ở tiêu đề, ở đoạn thứ nhất, hay ở đoạn mã.

– Ngôn ngữ để tìm kiếm. Đây là một chi tiết đáng lưu ý vì nếu bạn muốn tìm tài liệu bằng tiếng Việt thì bạn nên chuẩn bị một bộ gõ tiếng Việt như Vietkey hay Unikey để có thể gõ những từ khóa mà bạn muốn tìm bằng tiếng Việt, khi đó kết quả dò tìm sẽ chính xác hơn nhiều.

– Các trang web bao gồm các file hình ảnh, video, MP3/nhạc, ActiveX, JAVA…]

– Thời gian các trang web được xây dựng hoặc bổ sung thông tin mới.

Sau cùng, bạn nhớ theo dõi quá trình tìm kiếm bằng cách:

– Liệt kê những trang bạn đã xem qua, thời gian xem.

– Xem các trang web, đặc biệt là địa điểm và ngày bạn tìm thấy

3. Những thao tác tải và lưu thông tin sau khi bạn đã tìm được

– Nếu lưu văn bản [file text, htm] : vào File – Save as [chọn các kiểu lưu văn bản]

– Nếu lưu file [.doc,.pdf, .exe] : Nhấp chuột vào file cần tải, sau đó lưu.

– Ngoài ra, bạn có thể dùng những công cụ tải thông tin. Trên Internet hiện nay có khá nhiều công cụ hỗ trợ tải [download] file khá hiệu quả như: Get right, Mass download, Internet Download Manager, Flashget, Gigaget… là những công cụ tải file hay Teleport, Webcopyer…là những công cụ tải web.

Nguồn: //www.hieuhoc.com

Video liên quan

Chủ Đề