Tìm kiếm bằng sáng chế dựa trên tương đồng ngữ nghĩa

Main Article Content

Dương Hớn Minh

Abstract

Tìm kiếm dựa trên từ khóa là một công cụ tìm kiếm phổ biến, cổ điển và còn nhiều hạn chế. Trong khi đó, tìm kiếm bằng ngữ nghĩa có thể hiểu được chủ đề hay ý nghĩa cụ thể của từng đoạn và câu văn. Hai kĩ thuật chính trong tìm kiếm ngữ nghĩa gồm: tìm kiếm vectơ (vector search) và xử lí ngôn ngữ tự nhiên (Natural Language Processing) cho tài liệu bằng sáng chế tiếng Anh. Nguồn dữ liệu được lấy từ trang web USPTO thuộc về chính phủ Mĩ. Điểm mới của nghiên cứu là tìm được những tài liệu gần nghĩa với tài liệu cho trước, tốc độ tìm kiếm nhanh và chính xác hơn. Kết quả đạt được ban đầu của nghiên cứu tỏ ra hiệu quả so với các phương pháp tìm kiếm đồng nghĩa khác thể hiện ở tốc độ tìm kiếm chỉ tốn 0,3775 giây để tìm ra 10 bằng sáng chế có độ tương đồng cao nhất trong kho dữ liệu gồm 694 bằng sáng chế. Nghiên cứu này đã đưa ra phương pháp tìm kiếm mới để giải quyết vấn đề tìm kiếm bằng sáng chế tương đồng vì tránh đăng kí trùng ý tưởng của tác giả và bảo hộ quyền sở hữu và quyền thương mại.


® 2023 Journal of Science and Technology - NTTU

Article Details

Section
Articles