Wednesday, April 25, 2007

Tìm kiếm trong Google

    Trong những giai đoạn đầu, khi mà Internet du nhập vào Việt Nam(1997), đa số người dùng sử dụng Internet như là một công cụ để giải trí, ít có người nào sử dụng Internet vào đúng mục đích của nó.


   Internet là một kho thông tin khổng lồ của toàn nhân loại, bạn có thể thấy bất cứ loại thông tin nào trên Net. Trong thời đại CNTT hiện nay, ai nắm bắt và xử lý được thông tin thì người đó sẽ thắng. Vì vậy, nhu cầu tìm kiếm thông tin đã trở nên cần thiết với một bộ phận không nhỏ người dùng.

  Theo thống kê của tạp chí pcword, hiện nay, người dùng chủ yếu tìm kiếm các loại tài liệu sau: sách(ebook), tài liệu tham khảo(doc, pdf, ppt…), hình ảnh, âm nhạc(mp3, wma…), các chương trình, các bài báo, sự vật, sự kiện…

1. Các phương pháp tìm kiếm đơn giản trong google:
1.1 Nền tảng:

· Tìm kiếm theo cụm từ:
 Mặc định, google sẽ tìm kiếm tất cả những từ trong cụm từ của bạn đưa ra mà có xuất hiện trong một trang. Nếu bạn muốn tìm sao cho cụm từ đó đi liền với nhau, bạn hãy cho chúng vào trong dấu ngoặc kép("")
 VD: "I lay my love on you"

· Boolean đơn giản:
 Phép and và phép or được cho phép trong google. Bạn có thể dùng trực tiếp chữ and và chữ or, hoặc bạn có thể dùng gián tiếp thông qua 2 kí tự là + và |.
 VD: Bạn muốn tìm kiếm một trang nào đó vừa có chó, vừa có mèo: dog and cat.
 VD: Bạn muốn tìm trang có chó và có thêm hoặc mèo, hoặc cá: dog and (cat | fish)

· Tìm kiếm loại bỏ:
 Bạn có thể dùng dấu trừ(-) để loại bỏ một yếu tố nào đó ra khỏi phần tìm kiếm của bạn
 VD: Bạn muốn tìm trang nói về Bush nhưng không có Blair: Bush –Blair(bạn nên viết ngay sau dấu trừ mà không có khoảng trắng)

· Đồng nghĩa:
 Bạn dùng kí từ ~ để tìm những từ đồng nghĩa.
 VD: Nếu bạn gõ vào hộp tìm kiếm ~ape thì bạn sẽ tìm thấy một loạt các từ đồng nghĩa như monkey, gorilla, chimpanzee.

· Tìm kiếm có số:
 Một số từ khóa dành cho số: $: tiền, size: kích thước, kg: trọng lượng, megapixel: zoom của máy chụp hình…
 VD: bạn muốn tìm mua cho chú chú của bạn một cái áo mưa giá khoảng 10~20USD: raincoat dog $10..20
 Maximum là 20$: raincoat dog ..$20
 Minimum là 10$: raincoat dog $10..

· Case sensitive:
Trong google không phân biệt hoa thường

1.2 Full – word wildcards:
· Full – word wildcard là cho phép bạn sử dụng kí tự thay thế. Khi bạn không biết phần đó trong câu truy vấn của bạn là gì, bạn có thể sử dụng chức năng hỗ trợ này.
· Google cho phép bạn sử dụng wildcard character
· Kí tự thường được sử dụng là:* nhưng đôi khi bạn cũng có thể sử dụng kí tự ?
· VD: khi bạn đánh câu truy vấn này:"I have * dogs" thì kết quả có thể sẽ là: "I have 3 dogs", "I have 4 dogs"…

1.3 10 word limit:
· Đơn giản là bạn không nên đánh quá 10 từ trong câu truy vấn của bạn(kể cả các từ khóa)
· Khi câu truy vấn quá dài, bạn có thể sử dụng chức năng full - word wildcard để giảm bớt số từ xuống.

2. Các syntax trong google:
2.1 Intitle:
· Giới hạn nội dung tìm kiếm nội trong title của các trang.
· Thông thường, khi bạn tìm kiếm mà kết quả ra quá nhiều, bạn nên sử dụng từ khóa này.
· Từ khóa allintitle cũng tương tự như từ khóa intitle, nhưng sẽ xiết chặt hơn trong tìm kiếm. Từ khóa này sẽ làm việc không tốt khi liên kết với một từ khóa khác
· VD:intitle:"Thinking in Java"

2.2 Intext:
· Chỉ tìm kiếm trong phần body của một trang.
· Lưu ý: phớt lờ tất cả các phần như: title, url, link text…
· Thường dùng để tìm kiếm trong trường hợp từ khóa quá phổ biến đối với các url, link text. Như là: yahoo.com, html…
· Từ khóa allintext cũng tương tự như intext, nhưng một lần nữa, nó không làm việc tốt khi mà kết hợp với các từ khóa khác.

2.3 Inanchor:
· Tìm kiếm nội trong đoạn mô tả(descriptive text) của một link text.
· Như thế nào là một descriptive text: VD: "<a href=http://mail.yahoo.com>Mở Yahoo mail</a>. " . Đối với VD vừa rồi thì "Mở Yahoo mail" là descriptive text.
· Tương tự như trên, sẽ có một từ khóa allinanchor là giống với inanchor.

2.4 Site:

· Cho phép bạn giới hạn việc tìm kiếm nội trong một trang hay một domain nào đó.
· Tương tự như từ khóa host và domain trong Alta Vista.
· VD: site:com, site:hcmuns.edu.vn

2.5 Inurl:

· Giới hạn việc tìm kiếm nội trong url của trang đó.
· Từ khóa allinurl tương tự.

2.6 Link:

· Trả về danh sách các trang mà có liên kết đến trực tiếp đến link được chỉ định.
· VD: link:www.google.com sẽ trả về các trang có liến kết đến trang chủ google.

2.7 Cache:
· Tìm kiếm nội trong phần cache của google.
· Thông thường, bạn sử dụng phương pháp này khi trang đó đã down hay bạn muốn tìm kiếm một thông tin nào đó mà hiện nay trang đó không còn lưu trữ nữa. Nhất là những trang tin tức.

2.8 Daterange:
· Bạn có thể tìm kiếm một thông tin trong một khoảng thời gian nào đó.
· Tuy nhiên, bạn sẽ có một khó khăn nảy sinh, đó là bạn phải đổi ngày đó ra giá trị ngày. VD: ngày 1/1/1 tương ứng với giá trị 1…

2.9 Filetype:
· Đây có thể coi là một trong những từ khóa lợi hại nhất của google.
· Với từ khóa này, bạn có thể tìm những định dạng file mà các bạn mong muốn.
· VD:intitle:football filetype:doc

2.10 Related:
· Tìm kiếm những trang có liên quan, hay những trang tương tự.
· Đây là cách hay để tìm kiếm những trang giống nhau.
· Bạn hãy thử gõ: related:www.google.com. Rồi xem xem kết quả sẽ là gì???

2.11 Info:

· Cung cấp thêm các thông thông tin có liên quan đến url đó. Những thông tin này bao gồm:
 Liên kết đến cache của url này
 Danh sách các trang liên kết đến url này
 Các trang có liên quan đến url
 Các trang có chứa url.

· Nhớ rằng, thông tin này phụ thuộc rất nhiều vào hệ thống chỉ mục và cache của google.

2.12 Phonebook:
· Tìm kiếm số điện thoại của một người
· Sử dụng tốt cho người dùng ở Mỹ.

3. Kết hợp các syntax lại với nhau:

3.1 Tại sao lại không thử kết hợp nhỉ???
· Không kết hợp khi mà hai vế lại loại trừ lẫn nhau. VD: site:google.com –inurl:google.
· Không sử dụng lại cùng một syntax. VD: site:com site:net.
· Không nên sử dụng all* để kết hợp ngoại trừ một số trường hợp đặc biệt.
· Không sử dụng quá nhiều syntax.

3.2 Phải kết hợp như thế nào đây?:
· Bạn hãy thử kết hợp tất cả các syntax lại với nhau.
· Không nên sử dụng all* trong kết hợp
· Không nên sử dụng những từ có tính "xã hội hóa" thấp. Tức là những syntax chỉ nên đứng một mình. Nhưhonebook, link…
· Kết quả tìm kiếm tốt hay không phụ thuộc nhiều vào kinh nghiệm của bạn.

3.3 Một số lưu ý:
 Advanced search:
· Bạn có thể tìm kiếm dựa trên các option đưa ra bằng cách vào link sau:http://www.google.com/advanced_search?hl=en.
· Với link trên, bạn sẽ bớt đi các phiền phức khi bạn cảm thấy việc sử dụng các từ khóa là quá sức đối với bạn.

Hiểu được url của google:
· Phân tích url sau: http://www.google.com/search?num=100&hl=en&q=%22the+funny+girl%22
· http://www.google.com/search?: là phần liên kết đến chức năng tìm kiếm của google.
· Num=100: số lượng kết quả giới hạn ở 100.
· Hl=en: ngôn ngữ thể hiện:en là tiếng Anh
· Q=… nội dung cần tìm kiếm.

Tạo một form tìm kiếm liên kết đến url:
"<form method="get" action="http://www.google.com/search"><input type="text" name="q" size=31 maxlength=255 value=""><input type="submit" name="sa" value="Search Google"></form>·"
· Chỉ cần với form trên, google đã hoàn toàn là của bạn rồi đó. Google sẽ là slave cho trang web của bạn.

Tìm kiếm hình ảnh:
· http://images.google.com/advanced_image_search: bạn có thể vào trực tiếp trang này để có thể tìm kiếm các hình ảnh.
· Bạn có thể cho biết kích thước của ảnh, loại ảnh, màu sắc hay là domain mà bạn muốn tìm trong đó.
· Google Image có 3 chế độ lọc:
* None: do nothing
* Moderate: lọc dựa trên hình ảnh
* Strict: lọc dựa trên cả hình ảnh và text.
· Tuy nhiên trong một số trường hợp, các chế độ lọc này có thể chống lại bạn trong việc tìm hiểu, nghiên cứu chính đáng.
· Bạn cũng có thể sử dụng các loại từ khóa sau: intitle, site, filetype, inurl. Rồi tập kết hợp các từ này lại với nhau. Dần dần, kết quả sẽ khá lên, và bạn sẽ là master of google.
· Tại sao bạn không thử sức mình bằng việc tìm kiếm ảnh các ngôi sao, hay logo của một công ty nào đó chẳng hạn. Hãy thử đi, bạn sẽ thấy hiệu quả ngay thôi mà.

Tìm kiếm các bài báo:
· Tìm kiếm bài báo đối với tôi có lẽ là việc đơn giản nhất trong google.
· Bạn chỉ việc kết hợp từ khóa bạn cần tìm + site:mà bạn muốn tìm kiếm về tin tức đó. Không lẽ bạn lại không biết một trang tin tức nào hay sao??
· Cứ cho là vậy đi, nhưng bạn cứ an tâm. Bạn hãy vào đây: http://news.google.com/, chỉ với một chút kiến thức về tiếng Anh là bạn có thể tìm kiếm được các thông tin mà mình quan tâm. Nơi đây là nơi mà google tập trung hầu hết các bài báo đến từ các trang khác nhau như:The China Daily, The New York Times…
· Bạn cũng có thể sử dụng các syntax cũ kết hợp với nhau. Thông thường, từ khóa intitle được sử dụng nhiều nhất. Cộng với một số từ khóa sau: source: case sensitive, hay location: thường là quốc gia.

Lập trình trong google:
· Những bạn có quan tâm đến lập trình google. Các bạn có thể lên địa chỉ sau: http://www.google.com/apis/download.html . Google cung cấp cho bạn một tập các hàm api cũng như doc hướng dẫn lập trình.
· Hỗ trợ rất nhiều ngôn ngữ như: Java, C#, VB, PHP…
· Tham khảo thêm chương 9 trong cuốn sách Google Hacks 2nd Edition.
· Không kết hợp khi mà hai vế lại loại trừ lẫn nhau. VD: site:google.com –inurl:google.
· Không sử dụng lại cùng một syntax. VD: site:com site:net.
· Không nên sử dụng all* để kết hợp ngoại trừ một số trường hợp đặc biệt.
· Không sử dụng quá nhiều syntax.

(sưu tầm)

1 comment:

Unknown said...

Cảm ơn bạn đã chia sẻ.
-------------------------------------------------------------------
dàn giáo nêm dàn giáo gia phan phun sơn bom dinh luong bơm màng