![Viblo's machine learning banner](/images/hero/slider-50x.png)
About us
Blog kỹ thuật dành cho các lập trình viên Việt Nam
Machine learning
Natural language processing
Deep learning
Our services
![Programming language detection](/images/our-services/programming_language_detection.png)
Programming language detection
![Spam detection](/images/our-services/spam_detection.png)
Spam detection
![Tag compare](/images/our-services/tag_compare.png)
Tag compare
![Auto tagging](/images/our-services/auto_tagging.png)
Auto tagging
![Language detection](/images/our-services/language_detection.png)
Language detection
![Recommendation system](/images/our-services/recommendation_system.png)
Recommendation system
![Plagiarism detection](/images/our-services/plagiarism_detection.png)
Plagiarism detection
![More services later...](/images/our-services/more.png)
More services later...
Bạn tò mò về cách thức hoạt động của dịch vụ trên?
Dưới đây là ý tưởng chung của các dịch vụ đó!
Spam detection
Hệ thống trí tuệ nhân tạo được training trên gần 15,000 bài viết về công nghệ hiện có trên Viblo cũng như các bài báo, quảng cáo khác giúp xác định được đâu là bài đăng có nội dung không liên quan tới lĩnh vực công nghệ với độ chính xác rất cao (99,7%) trong khoảng thời gian không đáng kể (ms).
Language detection
Sử dụng giải thuật Đồ thị N-Gram (Graph-based N-Gram) và các kĩ thuật xử lý dữ liệu dạng kí tự Unicode để đưa ra giải thuật giúp định nghĩa ngôn ngữ xuất hiện trong văn bản và có khả năng huấn luyện thêm các ngôn ngữ khác nếu có một tập dữ liệu đủ tốt.
Ứng dụng trong việc hỗ trợ cho người dùng lựa chọn ngôn ngữ cho bài viết của mình, trợ giúp đắc lực cho việc tìm kiếm bằng Elasticsearch được chính xác hơn.
Recommendation system
Với khối lượng thông tin/ kiến thức khổng lồ (20000 bài viết thuộc hơn 100 chủ đề hiện nay và vẫn còn đang liên tục được gia tăng) chúng tôi rất để ý tới việc làm sao có thể đưa cho bạn đọc được những bài viết mà họ thực sự quan tâm. Dựa trên số liệu về các bài post mà người dùng đã đọc và nhiều thông tin khác, chúng tôi đã thiết kế một hệ thống khuyến nghị để phục vụ cho nhu cầu vô cùng cần thiết này.
Plagiarism detection
Vấn đề đạo văn hiện nay đang trở thành một vấn đề nóng của xã hội, đặc biệt khi các công trình nghiên cứu, các bài viết/bài chia sẻ có thể dễ dàng được tiếp cận. Mong muốn tạo ra một trang web mà mỗi bài viết đều thể hiện được giá trị riêng của tác giả, đem lại được những kiến thức có ích, không trùng lặp cho người xem, chúng tôi giới thiệu hệ thống đạo văn. Với việc xem xét trên hàng trăm trang web, diễn đàn về công nghê, hệ thống sẽ phát hiện và chỉ ra việc đạo văn một cách cụ thể và dễ dàng.