Học, học nữa, học mãi...!

Câu lạc bộ Học Tập Tích Cực và Nghiên Cứu Khoa Học
 
Trang ChínhTrang Chính  PortalPortal  CalendarCalendar  Trợ giúpTrợ giúp  Tìm kiếmTìm kiếm  Đăng kýĐăng ký  Đăng NhậpĐăng Nhập  

Share | 
 

 Phuong phap tim kiem tai lieu khoa hoc tren mang

Xem chủ đề cũ hơn Xem chủ đề mới hơn Go down 
Tác giảThông điệp
dorehg

avatar

Tổng số bài gửi : 7
Join date : 12/05/2010
Age : 25
Đến từ : Ha Noi

Bài gửiTiêu đề: Phuong phap tim kiem tai lieu khoa hoc tren mang   Tue Jul 06, 2010 10:41 am

Laughing Minh vua moi tham khao "Phuong phap nghien cuu khoa hoc o tren mang" ,cai ne hay thiet >< ,minh xin trich dan ra day e moi nguoi cung xem nha' Smile hj hj
Đặc điểm các nguồn tài nguyên
Có nhiều cách phân loại các nguồn tài nguyên thông tin khoa học và kĩ thuật.
• Theo phương tiện phát hành: tài liệu in trên giấy (sách, báo); tài liệu trên băng đĩa từ (băng cassette, video); tài liệu trên đĩa quang (CD-ROM, DVD); tài liệu chỉ phát hành trên Internet; v.v.
• Theo phương thức phân phối: ấn bản thương mại (sách, báo, tài liệu bán trên thị trường); ấn bản phi thương mại (khoá luận, luận văn, luận án, báo cáo kĩ thuật,... gọi chung là "văn liệu xám").
• Theo độ sâu chuyên môn: tài liệu khoa học phổ thông; tài liệu khoa học kĩ thuật chuyên ngành.
• Theo phương thức soạn thảo:
o Tài liệu nguyên cấp (primary document/document primaire): cung cấp thông tin gốc, trực tiếp, nghĩa là người đọc tiếp nhận thông tin đúng ở trạng thái mà tác giả đã viết. Các tài liệu dạng này là: sách, bài báo chuyên ngành, luận án, báo cáo, từ điển, bách khoa thư, băng đĩa khoa học, v.v.
o Tài liệu thứ cấp (secondary document/document secondaire): cung cấp các thông tin nhận diện, định vị hoặc phân tích tài liệu nguyên cấp. Các thông tin dạng này thường gặp ở các thư mục thư viện, các cơ sở dữ liệu tóm tắt, các chỉ mục khoa học, v.v.
o Tài liệu tam cấp (tertiary document/document tertiaire): mô tả và đánh giá tổng hợp thông tin từ các nguồn thứ cấp và nguyên cấp. Tài liệu dạng này giống tài liệu thứ cấp ở chỗ cung cấp thông tin nhận diện, định vị tài liệu nguyên cấp, nhưng khác ở chỗ có tổng hợp, phân tích và sắp xếp lại thông tin gốc. Tài liệu tam cấp thường gặp là: bài viết niên giám chuyên ngành (annual review/revue de la littérature annuelle); bài tổng hợp tài liệu (literature review/revue de la littérature); v.v.


Hiểu rõ đặc điểm các nguồn tài nguyên này có thể giúp lựa chọn tốt công cụ tìm kiếm phù hợp với loại tài liệu cần tham khảo.
• Các thư mục thư viện: giúp tìm kiếm được các tài liệu nguyên cấp được lưu trữ trong thư viện như sách, tạp chí (theo tựa báo), tài liệu nghe nhìn, các văn bản nhà nước, các luận văn, luận án, v.v. Nhiều thư viện lớn hiện nay đã tin học hoá thư mục để có thể tra cứu trực tuyến, với nhiều chức năng tìm kiếm theo tên tác giả, tựa tài liệu, từ khoá, chủ đề, v.v.
• Các cơ sở dữ liệu tóm tắt: sắp xếp thông tin theo một cấu trúc, trật tự rõ ràng, giúp tìm kiếm dễ dàng các tài liệu nguyên cấp (phổ biến nhất là các bài báo đăng trên các tạp chí chuyên ngành) theo nhiều tiêu chí khác nhau: tác giả, tựa tài liệu, chủ đề, từ khoá, năm xuất bản, v.v. Trước đây thường được phát hành dưới dạng bản in hoặc đĩa CD-ROM, nhưng hiện nay đa số các cơ sở dữ liệu này đều có phiên bản trực tuyến. Thường chỉ tìm thấy bài tóm tắt, nhưng có thể có một số bài toàn văn.
• Các danh bạ mạng và bộ máy tìm kiếm trên Internet: cho phép tìm kiếm gần như đủ loại tài liệu được đăng trên hệ thống Mạng toàn cầu (World Wide Web), kể cả các nguồn tài liệu nguyên cấp hay thứ cấp. Tuy nhiên, tính phù hợp và độ tin cậy của thông tin tìm được bằng các công cụ này không phải lúc nào cũng tốt, thường đòi hỏi người tìm kiếm phải biết đánh giá nghiêm túc các kết quả tìm thấy và chọn lọc những tài liệu có giá trị.
Các nguồn tài nguyên truyền thống
Thông thường, địa điểm đầu tiên cần nghĩ đến khi tìm kiếm tài liệu tham khảo khoa học, đó là các thư viện và trung tâm tài liệu.
Thư viện
Có thể hiện nay các thư viện Việt Nam (thư viện quốc gia, thư viện chuyên ngành khoa học, thư viện đại học,...) chưa có đủ một lượng tài liệu mới dồi dào, phong phú, đáp ứng nhu cầu của đông đảo các nhà nghiên cứu thuộc nhiều lĩnh vực, nhưng điều đó đang thay đổi từng ngày một. Đồng thời, không thể bỏ qua lượng tài liệu tuy cũ nhưng có tính chất kinh điển, căn bản, đã được chọn lọc và tích luỹ trong thời gian dài. Và vẫn có một xác suất không nhỏ có thể tìm thấy những tài liệu thực sự quan trọng cho một đề tài nghiên cứu.
Các loại tài liệu lưu trữ ở thư viện bao gồm sách, tạp chí, tài liệu nghe nhìn, các văn bản nhà nước, các luận văn, luận án, v.v., được sắp xếp và phân loại một cách khoa học, trật tự.
Để phục vụ tra cứu, các thư viện thường lập các phiếu thư mục mô tả vắn tắt về tài liệu được lưu trữ (phổ biến nhất là sách), theo một hệ thống được quy định riêng. Qua các phiếu thư mục, có thể tìm thấy tên tác giả, tựa tài liệu, thông tin ấn loát (năm xuất bản, phương tiện phát hành, số trang hoặc dung lượng, v.v.) Các phiếu thư mục có thể được sắp xếp theo chủ đề, theo tên tác giả hoặc theo tựa tài liệu, tuỳ theo cách tổ chức của thư viện.
Với sự phát triển của công nghệ thông tin và Internet hiện nay, việc tin học hoá hệ thống thư mục của các thư viện là xu thế tất yếu. Nhiều thư viện lớn hiện nay đã tin học hoá thư mục để có thể tra cứu trực tuyến, với nhiều chức năng tìm kiếm theo tên tác giả, tựa tài liệu, từ khoá, chủ đề, v.v.
• Thư viện Quốc gia Việt Nam: http://www.nlv.gov.vn/
• Thư viện Quốc hội Hoa Kì: http://catalog.loc.gov/
• Thư viện Anh quốc: http://www.bl.uk/
• Thư viện Quốc gia Pháp: http://www.bnf.fr/
• V.v.

Sử dụng các thư mục thư viện có những ưu điểm và nhược điểm riêng, được tóm tắt trong bảng dưới đây.
Ưu điểm Nhược điểm
Tài liệu có sẵn
Các tài liệu lưu trữ trong thư viện thông thường đều sẵn sàng để người đọc mượn tham khảo, ngoại trừ những trường hợp đặc biệt. Các tài liệu dù cũ hay mới đều được lập phiếu thư mục. Lượng tài liệu có hạn
Thư viện chỉ có thể giúp người đọc tiếp cận với những tài liệu mà thư viện có lưu trữ.
Chất lượng tài liệu được kiểm chứng
Thông thường, bộ phận nhập tài liệu của thư viện đều có sự kiểm tra, lựa chọn để đảm bảo giá trị, tính phù hợp và lợi ích của tài liệu được nhập vào. Không thống kê các bài báo (tạp chí chuyên ngành)
Trong thư mục của thư viện thường chỉ liệt kê đến tựa báo, tựa tạp chí chuyên ngành mà không liệt kê đến từng bài báo như trong các cơ sở dữ liệu tóm tắt.
Dễ tìm kiếm
Các tài liệu thường được sắp xếp theo chủ đề trên các kệ sách, do đó nếu tìm được một tài liệu phù hợp với nhu cầu thì dễ dàng tìm thấy nhiều tài liệu khác cùng chủ đề, có thể cũng rất hữu ích cho đề tài. Thông tin chậm cập nhật
Hầu hết các tài liệu liệt kê trong thư mục của thư viện đều đã được xuất bản trước đó một thời gian, hoặc đề cập đến những sự kiện xảy ra từ khá lâu (thường từ 2-3 năm trở lên). Do đó, thông tin mà các tài liệu này cung cấp có thể không có nhiều tính thời sự.

Các trung tâm tài liệu
Bên cạnh hệ thống thư viện được tổ chức quy củ, chặt chẽ, các trung tâm tài liệu (của các đơn vị nghiên cứu, các tổ chức chuyên môn,...) có quy mô nhỏ hơn, nhưng bù lại, các tài liệu lưu trữ có tính đặc thù chuyên môn cao, nhất là các tài liệu tập trung về một số chủ đề chuyên biệt, là thế mạnh hay mối quan tâm ưu tiên của từng đơn vị.
Thông tin về các trung tâm này có thể tìm thấy trong danh bạ các đơn vị chuyên ngành, hoặc đôi khi có thể trên Internet.
Các tủ sách chuyên ngành
Đây là dạng "trung tâm tài liệu thu nhỏ", thường gặp ở các bộ môn hoặc khoa ở trường đại học, các phòng thí nghiệm, v.v. Các tài liệu cũng có tính đặc thù cao.
Nói chung, trong xu thế phát triển mạnh mẽ của các nguồn tài nguyên trên Mạng, các nguồn tài nguyên truyền thống dễ bị các nhà nghiên cứu quên lãng hoặc bỏ qua khi tìm tài liệu. Tuy nhiên, cần khẳng định lại rằng, nếu biết cách khai thác nghiêm túc các nguồn tài nguyên truyền thống kể trên, nhà nghiên cứu hoàn toàn có thể tìm được những tài liệu tham khảo có giá trị cho đề tài của mình. Vấn đề then chốt là xác định được loại tài liệu nào cần, có ở đâu, để tiếp cận được một cách hiệu quả.
Các cơ sở dữ liệu
Các cơ sở dữ liệu thông tin khoa học kĩ thuật thường được các công ti, tổ chức lớn xây dựng, bằng cách tập hợp thông tin tóm tắt từ rất nhiều các tạp chí chuyên ngành khác nhau, sắp xếp và tổ chức sao cho việc tìm kiếm thông tin (chủ yếu là các bài báo đăng trên các tạp chí chuyên ngành) được dễ dàng hơn.
Thông tin về các tài liệu thường được cung cấp ở dạng tóm tắt, với tên tác giả, tựa bài, tựa tạp chí, thông tin ấn loát (năm, tập, số, trang), có hoặc không có bài giới thiệu tóm tắt nội dung (abstract/résumé) chính.
Mỗi cơ sở dữ liệu có cách tra cứu khác nhau, nhưng thông thường đều cung cấp nhiều khả năng kết hợp các công thức tìm kiếm khác nhau, từ đơn giản đến nâng cao. Phần lớn đều cho phép mở tài khoản tra cứu miễn phí nhằm lưu trữ các kết quả đã tìm kiếm, lịch sử các phiên làm việc, gửi kết quả hoặc thông báo, theo dõi tin tức qua thư điện tử, v.v.
Có nhiều kiểu cơ sở dữ liệu: tra cứu tóm tắt hoàn toàn miễn phí, không có toàn văn; tra cứu tóm tắt miễn phí, truy cập toàn văn thu phí; cả tra cứu và truy cập đều thu phí; tra cứu tóm tắt miễn phí và truy cập một số tài liệu miễn phí; v.v.

Ưu điểm và nhược điểm của các cơ sở dữ liệu được tóm tắt trong bảng dưới đây:
Ưu điểm Nhược điểm
Bổ khuyết cho các thư mục thư viện
Giúp tìm kiếm các tài liệu mà thư mục thư viện không thống kê, chủ yếu là các bài báo chuyên ngành.
Thông tin cập nhật
Giúp tìm được những thông tin mới mẻ, cập nhật, có tính thời sự.
Thống kê chi tiết các bài báo đăng trên các tạp chí chuyên ngành
Đây là công cụ chính nên dùng để tìm các bài báo chuyên ngành.
Cung cấp các thông tin tham khảo chính xác
Nhờ các tính năng kết hợp các công thức tìm kiếm khác nhau, thông tin tìm thấy qua các cơ sở dữ liệu sẽ có tính chính xác cao độ. Khả năng tiếp cận tài liệu hạn chế
Do thông tin được tập hợp theo chuyên ngành, từ rất nhiều nguồn khác nhau, do đó không phải lúc nào cũng có thể tiếp cận được toàn văn tài liệu. Rất thông thường, nhất là trên các cơ sở dữ liệu trực tuyến, muốn có toàn văn phải trả phí dịch vụ cho nhà cung cấp.
Cách sử dụng phức tạp
Nói chung, do có tính chuyên sâu nên các cơ sở dữ liệu thường đòi hỏi người sử dụng có những kĩ năng đôi khi khá phức tạp, cần mất nhiều thời gian để làm quen và làm chủ được thao tác.

Giới thiệu một số cơ sở dữ liệu lớn
• Current Content: là cơ sở dữ liệu tóm tắt nổi tiếng nhất, do ISI (Institute for Scientific Information) phát triển, bao gồm thông tin tóm tắt các bài báo của trên 14.000 tạp chí chuyên ngành thuộc đủ mọi lĩnh vực. Các nguồn tra cứu miễn phí truy cập tại mục Free Resources, trong đó có:
o Master Journal List: danh sách các tạp chí chuyên ngành có uy tín, thuộc hầu hết các chuyên ngành khoa học và kĩ thuật, do ISI bình chọn với các tiêu chí rất nghiêm ngặt;
o Current Patents Gazette: thông tin phát minh sáng chế hàng tuần trên khắp thế giới;
o Index to Organism Names: chỉ mục tên khoa học các loài sinh vật;
o ISI Highly Cited.com: cơ sở dữ liệu các chuyên gia và đơn vị nghiên cứu có uy tín khoa học trên khắp thế giới;
o In-cites: thông tin xếp hạng khoa học của các quốc gia, trường đại học, tạp chí, nhà nghiên cứu, bài báo, v.v.;
o Expert Essays: các cơ sở dữ liệu và thông tin chuyên sâu về các trích dẫn khoa học;
o v.v.

• Applied Science & Technology Abstracts: tóm tắt (từ 1993) và chỉ mục (từ 1983) của trên 1,3 triệu bài báo của 485 tạp chí chuyên ngành thuộc các lĩnh vực khoa học ứng dụng và công nghệ. Phải đăng kí thành viên mới tra cứu được.
• Chemical Abstracts: cơ sở dữ liệu hàng đầu thế giới trong lĩnh vực hoá học, do Hiệp hội Hoá học Hoa Kì (CAS) xây dựng và phát triển. Phải sử dụng các phần mềm chuyên dụng do CAS cung cấp mới tra cứu được.
• Georef: cơ sở dữ liệu khoa học địa lí do Viện Địa lí Hoa Kì (AGI) xây dựng từ năm 1966, giới thiệu gần 3 triệu tài liệu gồm các bài báo, tựa sách, bản đồ, báo cáo hội nghị, báo cáo kĩ thuật, luận án, và hàng năm cập nhật hơn 90.000 tài liệu mới. Tuy nhiên phải đăng kí và trả tiền mới tra cứu được.
• ACM: cơ sở dữ liệu tóm tắt và toàn văn về khoa học máy tính, do Hiệp hội Máy tính Hoa Kì (Association for Computing Machinery) phát triển. Tìm kiếm đơn giản miễn phí, phải đăng kí mới dùng được các chức năng tìm kiếm nâng cao và truy cập toàn văn.

• PubMed: cơ sở dữ liệu khổng lồ về các bài báo chuyên ngành y học, hoá sinh và sinh học phân tử, do Thư viện Y học Quốc gia Hoa Kì (NLM) xây dựng và phát triển. Thông tin tóm tắt có hệ thống, có thông tin thống kê trích dẫn, có liên kết đến các nguồn cung cấp toàn văn (miễn phí hoặc thu phí) cho các bài báo.
• Articles@INIST: cơ sở dữ liệu các tài liệu chuyên ngành do Viện Thông tin Khoa học và Kĩ thuật Quốc gia Pháp (INIST) phát triển.
o Các tài liệu được đưa vào cơ sở dữ liệu này phải trải qua một quá trình đánh giá nghiêm ngặt của một hội đồng chuyên môn, nên giá trị khoa học rất cao.
o Hiện nay đã có gần 2 triệu (từ 1990) tài liệu được lưu trữ, và hàng ngày cập nhật hàng ngàn tài liệu mới.
o Tra cứu tóm tắt miễn phí bằng hai giao diện tiếng Pháp và tiếng Anh.
o Có thể sử dụng từ khoá bằng nhiều thứ tiếng khác nhau.
o Truy cập toàn văn có thu phí.
o Nhà nghiên cứu ở các nước phương Nam (đang phát triển) được Tổ chức Đại học Pháp ngữ (AUF) hỗ trợ phần lớn kinh phí (65-85 %) để mua các tài liệu này. Ở Việt Nam có ba trung tâm hỗ trợ đặt tại Hà Nội, Đà Nẵng và TP. HCM.
• V.v.
Các danh bạ mạng
Một trong những loại công cụ tìm kiếm thông tin đầu tiên trên Internet là danh bạ mạng (Web directory/annuaire en ligne). Danh bạ nổi tiếng đầu tiên có lẽ là Yahoo!, ra đời năm 1994, do David Filo và Jerry Yang sáng lập. Tuy nhiên, với sự phát triển nhanh chóng của nhiều công cụ tìm kiếm khác, dường như các danh bạ mạng ngày càng ít được nhớ đến. Nhưng cũng không vì thế mà danh bạ mạng đánh mất đi giá trị của mình. Và nếu biết cách khai thác, người sử dụng Internet sẽ nhanh chóng tìm được những nguồn thông tin vô cùng hữu ích và có giá trị từ Internet.
Mục đích của danh bạ mạng
Các danh bạ mạng phân loại và sắp xếp các website theo các chủ đề lớn-nhỏ, chính-phụ,... giúp người dùng mạng dễ tìm kiếm hơn: ngay từ trang tiếp đón, người duyệt mạng tìm thấy một danh sách các mục và phụ mục sắp xếp theo chuyên đề, và chỉ cần nhấp chuột lên một chuyên đề rồi đi tiếp theo các chuyên đề phụ, để cuối cùng tìm thấy một danh sách các điểm mạng phù hợp với nhu cầu tìm kiếm.
Nguyên tắc hoạt động
o ng.
o Lập chỉ mục: khi website đã được tuyển chọn, ban biên tập sẽ đưa vào chỉ mục ở vị trí phù hợp, và thường xuyên sắp xếp, tái cấu trúc các chuyên mục sao cho hợp lí.
Mô tả: các biênMột websitecó thể được giới thiệu miễn phí trong một danh bạ mạng, nhưng cũng có thể phải trả phí, tuỳ theo tiêu chí hoạt động của mỗi danh bạ mạng (vô vụ lợi hay mục đích thương mại, quảng cáo). Điều cốt lõi nhất là: các danh bạ mạng được xây dựng dựa trên công việc biên tập của một hệ thống biên tập viên, tức có sự chọn lọc và đánh giá của con người.
o Tuyển chọn: căn cứ tiêu chí hoạt động của danh bạ mạng, biên tập viên sẽ kiểm tra xem website cần giới thiệu có hoạt động hay không, có đáp ứng các yêu cầu về ngôn ngữ, về sự tôn trọng pháp luật và về tính mới mẻ, độc đáo trong nội dung hay khô tập viên sẽ soạn một nội dung tóm tắt cho mỗi website, thường có các phần: tên website, mô tả nội dung (có thể là một bài viết tóm tắt thực sự hoặc chỉ là trích lại vài dòng thông tin của website), và tên chuyên mục mà website được xếp vào. Một số danh bạ có thể giới thiệu thêm một hay vài thông tin khác như: địa chỉ mạng, từ khoá, tác giả website, khả năng tìm kiếm thông tin,...

Phương thức tìm kiếm
Có hai cách tìm kiếm thông tin trong các danh bạ mạng:
• Tìm theo mục và phụ mục: đây là cách tìm kiếm đơn giản nhất dành cho người dùng mạng.
o Chỉ cần nhấp chuột lên một mục mong muốn, sau đó đến một phụ mục, rồi một phụ mục con nữa, cho đến khi nào tìm thấy được website phù hợp với nhu cầu tìm kiếm.
o Các chủ đề được sắp xếp từ rộng nhất, rồi thu hẹp dần đến những chủ đề xác định nhất, qua nhiều cấp bậc liên tục. Số cấp bậc đề mục thay đổi tuỳ dung lượng và phạm vi nội dung mà danh bạ mạng giới thiệu.
• Tìm theo từ: cách này đòi hỏi người dùng mạng phải có những hiểu biết nhất định về chủ đề cần tìm.
o Chỉ cần gõ từ cần tìm vào ô tìm kiếm, và danh bạ sẽ thực hiện việc tìm kiếm trong toàn bộ nội dung của nó, bao gồm cả các chuyên mục và nội dung mô tả (tên website, tóm tắt,...).
o Cách này có thể giúp liệt kê ra những chuyên mục và website có chứa từ cần tìm trong tiêu đề và nội dung của chúng, nhưng không đưa ra được danh sách đầy đủ các website phù hợp với chủ đề mà danh bạ đã sưu tập được.

Ưu điểm và nhược điểm của các danh bạ mạng
Có thể rút ra những đặc điểm chính của các danh bạ mạng như sau:
• là công cụ "con người": kết quả tìm kiếm, đánh giá và chọn lọc của con người (thường là các chuyên gia trong từng lĩnh vực);
• sắp xếp "thủ công": cấu trúc các chuyên mục do con người xây dựng theo một quan điểm nhất định;
• chỉ giới thiệu tiêu đề: nội dung được giới thiệu là tên tài liệu/website, và mô tả tóm tắt, nhưng không lưu toàn văn tài liệu hay toàn bộ nội dung website;
• danh mục không hoàn chỉnh, không cập nhật: danh sách được giới thiệu trong mỗi chuyên mục không phải là đầy đủ và hoàn chỉnh mà có tính chọn lọc tuỳ theo tiêu chí của danh bạ và khả năng nắm bắt thông tin của người biên tập, đồng thời thời gian cập nhật rất chậm;
• tìm kiếm trên từ khoá chuyên đề: các từ khoá được sử dụng trong tên của các chuyên mục, tuy phụ thuộc vào quan điểm trình bày và sắp xếp của mỗi danh bạ, nhưng vẫn có độ tương đồng cao trong nhiều lĩnh vực.
Từ đó, có thể tạm đánh giá một số ưu điểm và nhược điểm của các danh bạ mạng:
Ưu điểm Nhược điểm
Dễ tìm thấy các chủ đề tổng quát
Khi biết trước cấu trúc các chuyên đề chính-phụ trong lĩnh vực cần tìm tài liệu, sử dụng các danh bạ mạng sẽ nhanh chóng tìm được những chủ đề có tính chất tổng quát.
Nguồn tài nguyên có chất lượng chọn lọc cao
Thông thường các nguồn tài nguyên giới thiệu trong danh bạ mạng có chất lượng khá cao, kết quả của quá trình chọn lọc, đánh giá nghiêm túc của các biên tập viên chuyên nghiệp.
Nguồn tài nguyên được giới thiệu có giới hạn
Các danh bạ mạng chỉ sưu tập được một phần rất nhỏ các tài nguyên hiện hữu trên Mạng.
Khó tìm thấy các chủ đề chuyên biệt
Những chủ đề quá chuyên biệt, có tính đặc thù cao trong một số lĩnh vực rất có thể không hoặc chưa có mặt trong các chuyên mục của các danh bạ mạng.
Chậm cập nhật
Vì là công việc "thủ công", việc cập nhật các danh bạ mạng diễn ra tương đối hoặc rất chậm.
Tìm kiếm theo từ khoá kém hiệu quả
Tìm kiếm theo từ khoá trong các danh bạ mạng thường ít khi mang lại ngay kết quả phù hợp như mong muốn.

Giới thiệu một số danh bạ mạng
• WWW Virtual Library: đây là danh bạ mạng đầu tiên, do Tim Berners-Lee, người phát minh ra World Wide Web, sáng lập tại Trung tâm Nghiên cứu Hạt nhân Châu Âu (CERN), Geneva, Thuỵ Sĩ.
o Mục tiêu hoàn toàn vô vụ lợi, được điều hành bởi một hội đồng được bầu chọn công khai.
o Biên tập viên là chuyên gia trong mỗi lĩnh vực.
o Cấu trúc chặt chẽ và gọn gàng, không quá 3 cấp chuyên mục.
o Tính chọn lọc rất cao, thường là các website giới thiệu các nguồn tài nguyên trên Internet trong từng lĩnh vực.
o Giao diện bằng 4 thứ tiếng: Anh, Tây Ban Nha, Pháp, Hoa.
• Bubl Link: danh bạ mạng do Thư viện Andersonian (Đại học Strathclyde, Scotland) xây dựng.
o Giới thiệu hơn 12.000 website và cơ sở dữ liệu trên Mạng, được một ban biên tập của thư viện chọn lọc, lưu chỉ mục, mô tả tóm tắt kĩ lưỡng.
o Sắp xếp, trình bày rõ ràng theo hệ thống phân loại thập phân Dewey, với các website thuộc tất cả các chuyên ngành, lĩnh vực mà thư viện phụ trách.
o Các chức năng tìm kiếm đa dạng, dễ sử dụng.
• Open Directory: là danh bạ mạng phổ thông lớn nhất còn giữ được hoạt động cho tới hiện nay.
o Tiêu chí hoàn toàn tự nguyện, vô vụ lợi.
o Đã sưu tập được gần 5 triệu website, xếp trong hơn 590.000 chuyên mục thuộc đủ các lĩnh vực, từ giải trí đến khoa học, với trên 75.000 biên tập viên (là chuyên gia trong lĩnh vực họ phụ trách).
o Được Google hỗ trợ để cải thiện khả năng tìm kiếm, bổ sung chức năng xếp hạng website,... trong Google Directory.
• Librarians' Internet Index: danh bạ mạng phổ thông, phát triển từ những năm 1990, hiện nay do Học viện Bảo tàng và Dịch vụ Thư viện (California, Hoa Kì) tài trợ, có bản tin hàng tuần gửi qua thư điện tử, thông báo danh sách cácwebsite mới được chọn lọc và giới thiệu với những tiêu chí rõ ràng.
• Internet Public Library: do Đại học Michigan xây dựng và phát triển, giới thiệu các nguồn tài nguyên dạy và học thuộc đủ các lĩnh vực. Có các chuyên mục đặc biệt hay như các lịch niên giám (almanac), bách khoa thư, tiểu sử, nguồn tham khảo, v.v.
• Science.gov: danh bạ các nguồn tài nguyên và kết quả nghiên cứu khoa học, do nhiều cơ quan khoa học Hoa Kì hợp tác xây dựng
Các bộ máy tìm kiếm
Các bộ máy tìm kiếm (search engine/moteur de recherche) ra đời từ giữa những năm 1990, với chức năng tìm kiếm khác hẳn các danh bạ mạng: thay vì tìm kiếm các websitenhư danh bạ mạng, các bộ máy tìm kiếm lại sưu tập các trang web, đọc toàn bộ nội dung của từng trang và lưu vào chỉ mục. Người dùng mạng chỉ cần gõ từ khoá cần tìm và bộ máy sẽ tìm trong toàn bộ các nội dung đó.
Phương thức tìm kiếm
Các bộ máy tìm kiếm tìm kiếm các thông tin trên Mạng bằng cách:
• sử dụng một chương trình gọi là robot (hay crawler, spider) tự động lướt khắp hệ thống Mạng toàn cầu thông qua các siêu liên kết (hyperlink/lien hypertexte) có trong mỗi trang web và sao chép toàn bộ nội dung (địa chỉ, tiêu đề, siêu dữ liệu metadata/metadonnée, các đoạn văn bản, v.v.) của những trang web mà nó đọc được;
• lập chỉ mục các trang web với tất cả những thông tin mà các robot đã sao chép được sau mỗi vòng hành trình qua khắp hệ thống Mạng;
• đưa chỉ mục lên Mạng, cho phép người dùng mạng tra cứu chỉ mục này thông qua một giao diện web, với cách thức trình bày và các chức năng tìm kiếm khác nhau, tuỳ mỗi bộ máy.
Nếu tưởng tượng Mạng toàn cầu là một thư viện khổng lồ, với mỗi website là một cuốn sách, mỗi trang web là một trang sách, thì:
• các danh bạ mạng giúp tìm đến được từng cuốn sách (với tiêu đề, tác giả, nhà xuất bản, năm xuất bản,...);
• các bộ máy tìm kiếm giúp tìm được đến từng trang sách, với từng câu, từng chữ, từng dòng thông tin, từng dấu chấm dấu phẩy trong mỗi trang, kể cả trang bìa, cũng như tất cả các yếu tố đi kèm như hình ảnh, tập tin, siêu liên kết,...

Với các bộ máy tìm kiếm, có thể:
• tìm những thông tin chính xác: như thông tin liên lạc của một cá nhân, tổ chức, hoặc chi tiết liên quan đến một sản phẩm nào đó;
• tìm những tài liệu chuyên biệt, đặc thù: như các công ước quốc tế, các văn bản nhà nước;
• tìm những website mới xuất hiện trên Mạng: với vòng quay tương đối nhanh, các robot có thể tiếp cận các trang web mới hoặc quay lại cập nhật các trang web đã lưu chỉ mục trong vòng vài tuần lễ;
• kết hợp các công thức tìm kiếm đa dạng, với các từ khoá, thuật ngữ, thuật toán khác nhau theo khả năng đáp ứng và công nghệ phát triển của từng bộ máy.
Tuy nhiên, có một điểm cần lưu ý khi sử dụng các bộ máy tìm kiếm, đó là các trang được đưa ra trong kết quả tìm kiếm không phải là trang hiện hữu trên Mạng, mà là trang được lưu trong chỉ mục của bộ máy tìm kiếm.
• Chỉ khi nhấn vào siêu liên kết thì mới truy cập vào đúng trang hiện hữu.
• Khi nội dung trang được mở ra không hoàn toàn giống với trang giới thiệu trong kết quả, điều đó có nghĩa là nội dung trang này đã được sửa mà robot của bộ máy tìm kiếm chưa kịp quay lại để cập nhật.
• Khi mở trang được giới thiệu trong kết quả tìm kiếm mà xuất hiện lỗi "Error 404. Page not found", điều đó có nghĩa là trang này đã bị xoá, không còn tồn tại trên Mạng, mà bộ máy tìm kiếm chưa kịp cập nhật hoặc xoá bỏ khỏi chỉ mục.

Các vấn đề kĩ thuật
Có một số bộ máy tìm kiếm phát triển thuật toán tra cứu theo một công nghệ đặc biệt: thay vì tìm kiếm theo từ chính xác trong toàn bộ chỉ mục, người dùng chỉ cần đặt một câu hỏi như trong ngôn ngữ tự nhiên, bộ máy sẽ phân tích nội dung câu hỏi để tìm các thông tin trả lời (vẫn trong các trang đã lưu chỉ mục) và đưa ra kết quả.
Mặc dù có phạm vi bao phủ rất rộng, nhưng các bộ máy tìm kiếm cũng chỉ thu thập và lưu chỉ mục được một phần rất nhỏ của toàn bộ thông tin hiện hữu trên Mạng toàn cầu, đặc biệt là hoạt động kém hiệu quả với các trang thuộc "mạng ẩn".
• Khái niệm "mạng ẩn" (web invisible) hay "mạng tầng sâu" (deep web/web profonde) dùng để chỉ những website sử dụng kĩ thuật tạo các trang động(dynamic page/page dynamique), và chỉ truy xuất được thông tin khi gửi yêu cầu thông qua một biểu mẫu (form/formulaire) truy cập cơ sở dữ liệu.
• Mạng ẩn hay mạng tầng sâu bao gồm các cơ sở dữ liệu (các bộ máy tìm kiếm không thể tự điền thông tin vào biểu mẫu để truy xuất thông tin), cácwebsite đòi hỏi có tài khoản sử dụng và đăng nhập trước khi truy xuất thông tin, các website mà người quản trị ngăn chặn việc truy cập của các robot,...
• Dung lượng của mạng ẩn hay mạng tầng sâu được đánh giá là lớn gấp hàng trăm lần dung lượng phần Mạng được các bộ máy tìm kiếm lưu chỉ mục (nhiều người gọi là "mạng rõ" - visible web/web visible hay "mạng tầng mặt" - surface web/web surfacique).

Ưu điểm và nhược điểm của các bộ máy tìm kiếm
Có thể rút ra những đặc điểm chính của các bộ máy tìm kiếm như sau:
• là công cụ tự động: kết quả tìm kiếm của các robot tự động lướt khắp Mạng toàn cầu thông qua các siêu liên kết;
• sắp xếp tự động: toàn bộ thông tin sao chép được của các robot được tự động lưu vào chỉ mục, với các trường thông tin đã lập trình sẵn;
• giới thiệu từng trang: tìm kiếm trong toàn bộ nội dung các trang web đã lưu chỉ mục;
• danh mục không hoàn chỉnh, không cập nhật: danh sách các website và trang web được lưu chỉ mục chỉ chiếm một phần rất nhỏ dung lượng Mạng toàn cầu, và thời gian cập nhật còn chậm (nhất là với các trang có ít siêu liên kết hướng vào);
• tìm kiếm trên từ chính xác: các kết quả được đưa ra có chính xác các từ được sử dụng trong công thức tìm kiếm.
Từ đó, tạm thời rút ra các nhận xét về ưu nhược điểm của các bộ máy tìm kiếm:
Ưu điểm Nhược điểm
Rất nhiều thông tin
Các bộ máy tìm kiếm có khả năng cung cấp một lượng thông tin rất khổng lồ.
Thông tin chính xác
Các bộ máy tìm kiếm cho phép tiếp cận được những thông tin rất chính xác, cụ thể.
Phân hạng kết quả
Thông thường các bộ máy tìm kiếm đều có cơ chế xếp hạng kết quả tìm kiếm theo mức độ phù hợp giảm dần. Dù sự xếp hạng là tự động, máy móc, nhưng hầu hết các thông tin phù hợp đều được tìm thấy trong những trang kết quả đầu tiên.
Cho phép kết hợp nhiều công thức tìm kiếm
Hầu hết các bộ máy tìm kiếm đều cung cấp nhiều khả năng tìm kiếm và phối hợp các công thức tìm kiếm khác nhau. Kiểm soát thông tin ít nhiều kém hiệu quả
Lượng dữ liệu khổng lồ lưu trữ trong chỉ mục dẫn đến sự hạn chế trong kiểm soát thông tin. Có rất nhiều địa chỉ cung cấp trong kết quả tìm kiếm không còn hoạt động.
Kĩ thuật tra cứu phức tạp
Giao diện và kĩ thuật tra cứu thay đổi tuỳ theo bộ máy tìm kiếm, dù vẫn có một số điểm tương đồng. Người mới làm quen với máy tính hay Internet cần không ít thời gian để có thể làm chủ được thao tác.
Kết quả đôi khi không liên quan hoặc thường bị "nhiễu"
Do toàn bộ quá trình sưu tập thông tin và lập chỉ mục đều tự động, và việc tìm kiếm được thực hiện trên toàn bộ thông tin của từng trang, có không ít kết quả không liên quan đến chủ đề tìm kiếm vẫn được đưa vào.
Bài tập tự kiểm tra

Giới thiệu một số bộ máy tìm kiếm
• Ask Jeeves: cơ chế tìm kiếm theo ngôn ngữ tự nhiên, có thể cho phép lưu trữ đến 1000 kết quả tìm kiếm, sắp xếp và ghi chú trong hồ sơ cá nhân. Có nhiều kiểu giao diện khác nhau cho người dùng lựa chọn, và các phiên bản tiếng Nhật, Tây Ban Nha, Đức, Pháp, Hà Lan, Ý.
• Brainboost: tìm kiếm theo ngôn ngữ tự nhiên, kết quả được trích từ các trang web có chứa thông tin trả lời cho câu hỏi được đặt ra.
• Exalead: hai giao diện Exalead tiếng Pháp và Exalead tiếng Anh. Có nhiều chức năng tìm kiếm nâng cao giúp giới hạn phạm vi tìm kiếm. Kết quả được giới thiệu kèm với hình ảnh thu nhỏ của trang web và những gợi ý giúp tìm kiếm kĩ hơn bằng các thuật ngữ, khái niệm lân cận và chủ đề liên quan.
• Factbites: cung cấp thông tin bách khoa, với những trích đoạn hoàn chỉnh và có nghĩa về vấn đề đang tìm kiếm, thu thập được từ các trang web khác nhau, gợi ý các chủ đề lân cận, có liên quan cũng như danh sách các chủ đề được tìm kiếm nhiều nhất. Giao diện duy nhất bằng tiếng Anh.
• Google: bộ máy tìm kiếm được sử dụng nhiều nhất hiện nay, sưu tập được một lượng thông tin vô cùng lớn trên Mạng, bằng hầu như tất cả các thứ ngôn ngữ có tồn tại trên Internet. Có nhiều tính năng tìm kiếm nâng cao khác nhau, giúp dễ dàng giới hạn phạm vi tìm kiếm. Có giao diện bằng nhiều thứ tiếng, kể cả tiếng Việt.
o Tiêu chí xếp hạng PageRank do Google định nghĩa dựa vào cách tính toán số siêu liên kết hướng vào (tăng điểm) và hướng ra (giảm điểm) của một website. Do đó, PageRank cao chỉ đồng nghĩa với mức độ phổ biến của một trang web hay website chứ không hoàn toàn đồng nghĩa với chất lượng thông tin của trang web hay website đó.
o Kết quả tìm kiếm được trình bày theo kiểu trích đoạn các phần nội dung có chứa chính xác từ cần tìm kiếm, đôi khi toàn bộ các đoạn trích không liên quan gì đến nhau.
o Kết quả của một lượt tìm kiếm thường quá nhiều, đến mức khó hoặc không thể xử lí nổi.
• Google Scholar: phiên bản thử nghiệm, giúp tìm kiếm các thông tin thuần tuý khoa học và học thuật (sách, tạp chí, luận văn, luận án, bài giảng,...), thu thập từ các trường đại học, viện nghiên cứu, phòng thí nghiệm, nhà xuất bản khoa học, các chuyên gia, các tổ chức, v.v.
• Scirus: tìm kiếm các tài liệu có tính học thuật trong các ngành khoa học (giới thiệu và/hoặc phổ biến qua Science Direct, PubMed, ArXiv, BioMed Central, v.v.), hiệu quả tốt hơn Google Scholar về nhiều mặt, với nhiều tính năng tìm kiếm nâng cao và giới hạn phạm vi tìm kiếm.
• Yahoo!: bộ máy tìm kiếm tương tự như Google, cũng khá phổ biến và hiệu quả, có nhiều chức năng tìm kiếm nâng cao, hạn chế phạm vi tìm kiếm, v.v.
Các nguồn tài nguyên khác
Ngoài các nguồn tài nguyên đã kể ở trên còn có nhiều nguồn tài nguyên khác từ lớn đến nhỏ, từ đơn giản đến phức tạp, đã, đang và sẽ phát triển từng ngày từng giờ trên Mạng, gần như không thể liệt kê, phân loại một cách đầy đủ và hoàn chỉnh.
Đối với việc tìm kiếm tài liệu khoa học kĩ thuật trên Internet, có nhiều nguồn thông tin khác khá chuyên biệt và đặc thù.
Các website trường, viện, phòng thí nghiệm
Hiện nay, đa số các trường đại học, viện nghiên cứu và phòng thí nghiệm lớn trên thế giới đều phát triển các ứng dụng web, đưa các nguồn tài nguyên giảng dạy, học thuật và nghiên cứu lên Mạng để cán bộ, giảng viên, sinh viên truy cập nội bộ, hoặc có nhiều phần được cho phép truy cập tự do.
• Danh sách các trường đại học được giới thiệu trong Open Directory
• Danh sách các trường được ISI xếp hạng khoa học cao năm 2007
• Danh sách các viện nghiên cứu khoa học (Open Directory)
• Các nguồn thông tin tổng quát về nghiên cứu của Bubl Link
Các tổ chức, hiệp hội khoa học lớn
Có rất nhiều tổ chức, hiệp hội khoa học lớn cung cấp nhiều nguồn tài liệu, thông tin trong lĩnh vực họ phụ trách, vô cùng phong phú, đa dạng và sâu sắc. Các tổ chức này thường có các chế độ ưu đãi phí dịch vụ, thậm chí miễn phí, cho thành viên của mình, cho các trường học, sinh viên, và đặc biệt hơn là cho các nước đang phát triển.
• Danh sách các viện và hiệp hội khoa học (Open Directory)
• Danh sách các quỹ đầu tư và tài trợ nghiên cứu (Open Directory)
• Danh sách các hiệp hội khoa học theo từng chuyên ngành (Open Directory)

Về Đầu Trang Go down
 
Phuong phap tim kiem tai lieu khoa hoc tren mang
Xem chủ đề cũ hơn Xem chủ đề mới hơn Về Đầu Trang 
Trang 1 trong tổng số 1 trang
 Similar topics
-
» Ôn thi tốt nghiệp khoa ĐKTB
» Tu chỉnh Hải đồ và Ấn phẩm hàng hải
» Các phương pháp cập cầu
» Thiết bị lái tàu thủy
» Các bài toán chạy tàu

Permissions in this forum:Bạn không có quyền trả lời bài viết
Học, học nữa, học mãi...! :: Kỹ năng mềm :: Các kỹ năng liên quan đến máy tính-
Chuyển đến