Thứ hai, 28/2/2005, 12:03 GMT+7

Xu hướng mới trong tìm kiếm thông tin nội bộ 

Cách đây khoảng 5 năm, tìm kiếm thông tin chỉ là gõ vào những ô chọn từ khóa. Ngày nay, các phần mềm tìm tin đa dạng hơn nhiều. Đôi khi, thông tin trên Internet dễ tìm hơn trên mạng nội bộ doanh nghiệp.

Doanh nghiệp thường săn tìm những sản phẩm tìm kiếm dạng phần mềm để đáp ứng nhu cầu đa dạng của mình. Ví dụ, các nhà nghiên cứu ở Trung tâm SLAC tại California (Mỹ) có nhu cầu mua một công cụ giúp họ lập chỉ mục và sắp xếp bản tin nội bộ hằng ngày từ khoảng 600 tin từ khắp nơi gửi về. Chương trình này phải dễ dùng, có thể điều chỉnh để phù hợp với yêu cầu của họ và có khả năng xử lý số lượng bản tin khổng lồ. Sau khi đánh giá nhiều sản phẩm tìm kiếm cả thương mại lẫn mã nguồn mở, cuối cùng họ chọn công cụ Swish-e thuộc dạng mã nguồn mở vì tốc độ xử lý nhanh và giá rẻ.

Tìm kiếm thông tin nội bộ cần những khả năng khác với tìm kiếm thông tin trên Internet vì người dùng muốn kết quả tìm kiếm được sắp xếp theo tầm quan trọng của nội dung chứ không phải tần số xuất hiện. Có ba dạng tìm kiếm thông tin phổ biến. Dạng "khám phá" là khi người tìm muốn biết xu hướng chung hay mối liên hệ giữa các dữ liệu. Dạng "thương mại điện tử" nhấn mạnh khả năng cho kết quả là sản phẩm hay dịch vụ phù hợp nhất với yêu cầu của khách hàng. Còn dạng "tìm thông tin về doanh nghiệp" phải có khả năng cung cấp chính xác điều người dùng cần tìm.

Ở các phần mềm tìm kiếm thông tin cao cấp, đầu tiên là khả năng tìm kiếm chưa sắp xếp thành cơ sở dữ liệu như các tài liệu ở dạng Word, PDF, trang web. Chúng cũng phải có khả năng sắp xếp kết quả theo mức độ liên quan, có thể tinh chỉnh theo yêu cầu của người dùng để doanh nghiệp có thể định ra các tiêu chí riêng mà họ cần.

Trung tâm SLAC còn dùng thêm công cụ Ultraseek để lập chỉ mục cho hơn nửa triệu trang chứa các nghiên cứu hiện có của trung tâm, các thông tin hành chính, các tài liệu tham khảo dạng PDF. Trước đây, việc cập nhật chỉ mục phải mất cả tháng, nay họ có thể cập nhật hằng ngày.

Ultraseek có khả năng giúp người dùng thiết lập tiêu chí dùng trong việc lập chỉ mục để gán tầm quan trọng cho một số nội dung. Nhờ thế, phần mềm có thể bỏ qua hàng nghìn trang tài liệu không liên quan đến công việc nghiên cứu của trung tâm mặc dù chúng cũng có chứa những từ thường được tìm kiếm.

Ngoài khả năng điều chỉnh theo nhu cầu riêng của khách hàng, phần mềm tìm kiếm thông tin nội bộ cũng phải có khả năng phân biệt tài liệu thuộc thể loại gì, thông cáo báo chí hay đơn đặt hàng, bài nghiên cứu hay chỉ là thông báo nội bộ. Một số còn thông minh hơn ở chỗ chúng có thể tự động quét và tóm tắt nội dung tài liệu. Các chức năng cao cấp gồm khả năng hiểu được thói quen tìm kiếm của người dùng để giúp họ tiếp cận thông tin đang cần nhanh hơn, chính xác hơn. Điểm đặc biệt là nhu cầu tìm thông tin ở các doanh nghiệp và tổ chức là khác nhau nên người làm phần mềm phải hợp tác chặt chẽ với khách hàng để hoàn thiện phần mềm, vì thế thị trường công cụ tìm kiếm thông tin nội bộ hiện rất đa dạng. Ngược lại, cũng nhờ quan sát thói quen tìm kiếm thông tin, các nơi sản xuất phần mềm tìm kiếm ngày càng hoàn thiện cơ chế tìm thông tin để cho kết quả chính xác.

Tìm kiếm thông tin không chỉ đơn thuần là dữ liệu ở dạng văn bản. Nhà xuất bản WorldBook cho biết họ phải cân nhắc khi tìm công cụ tiìm kiếm thích hợp cho trang từ điển bách khoa trực tuyến của họ vì ngoài 25.400 bài viết và 248.000 định nghĩa, cuốn bách khoa này còn có 9.300 đoạn âm thanh, 1.480 bản đồ, 128 bức ảnh và 115 mẫu phim video.

Ngay đối với văn bản, nhu cầu tìm thông tin chính xách đòi hỏi phần mềm phải biết phân tích để sắp xếp nội dung theo danh từ, động từ hay tính từ rồi sắp xếp theo ngữ cảnh.

(Theo Thời Báo Vi Tính Sài Gòn)