Amaç

IKS’nin temel amacı var olan içerik yönetim sistemlerine (İYS) anlamsal yetenekler katmaktır. IKS İYS’ler için veri tabanından, grafik arayüze kadar tüm katmanları hedefleyen anlamsal çözümler sunar. IKS kapsamında çeşitli yazılımlar üretilmiş olup, anlamsal servisler bu yazılımlar sayesinde sağlamaktadır. Apache Stanbol ve Vienna IKS Editables (VIE) IKS kapsamında geliştirilmiş yazılımların en önemli iki tanesidir.

Stanbol varolan İYS’lere anlamsal yetenekler katmayı hedefler ve buna yönelik çeşitli modüler servisler sunar. Adından da anlaşılacağı gibi Stanbol, Apache Software Foundation çatısı altında geliştirilen açık kaynak kodlu bir yazılımdır.

Stanbol’un en temel özelliklerinden biri metin içeriklerden varlık tanımaya yönelik çeşitli servisler sağlamasıdır. Bu işlemden sonra; kişi, yer, organizasyon gibi varlıklar Bağlı Açık Bilgi (Linked Open Data) üzerinde yer alan gerçek varlıklarla veya Stanbol’la ilişkilendirilmiş RDF veri setleriyle eşleştirilirler. Bu eşleştirme bir sonraki adımda, verinin kendisinin ve gerçek varlıklardan toplanan meta verinin anlamsal endeksleme ve arama servislerinde kullanılmasını sağlar.

VIE temel olarak web tabanlı içerik yönetim sistemlerinin grafik arayüzlerine anlamsal yetenekler kazandırmayı amaçlayan bir JavaScript kütüphanesidir. Kısaca özetlemek gerekirse, VIE içerik yönetim sistemlerine entegre edildiğinde arayüzde sunulan içerik üzerinde Stanbol servislerinin kullanılmasını sağlar.

Motivasyon

IKS Projesi kapsamında geliştirilen uygulamaların geliştirilmesinin arkasındaki en büyük etken var olan İYS’lerin içeriğin anlamına yönelik fonksiyonlar sağlamıyor oluşudur. Örneğin, klasik İYS’ler sistem anlamsal etiketlemeye yönelik yeteneklere sahip olmadıkları için, anlamsal açıdan zenginleştirilmiş metin editörleri, benzerlik doküman araması, otomatik kategorizasyon gibi özellikler veya servisler sunamazlar. Anlamsal etiketlemenin ötesinde, İYS içerisinde kontrol edilen dokümanlar/dosyalar benzerlik ve alakalarına göre birbirleriyle ilişkilendirilebilirler. Benzer olarak varolan İYS’ler sistem içinde saklanan içerik üzerinde kelime tabanlı aramanın üzerinde, gelişmiş içeriğin anlamını dikkate alan arama fonksiyonaliteleri sunmazlar. Bahsedilen anlamsal tabanlı eksiklikler IKS Projesi kapsamında geliştirilen teknolojilerin arkasındaki en büyük motivasyondur.

Rolümüz

IKS Projesi kapsamında SRDC Stanbol yazılımının geliştirilmesinde yer almıştır. Stanbol’un CMS Adaptor, Content Hub ve Ontology Manager modülleri SRDC tarafından geliştirilmiştir.

CMS Adaptor, JCR ve CMIS spesifikasyonlarını kullanarak İYS’lerle standard bir şekilde iletişim kurar ve bu sistemlerdeki metin içeriklerin ve bu içeriklerle alakalı olan meta verinin Stanbol içerisine aktarımını sağlar.

Content Hub, Apache Solr yazılımını kullanarak yarı otomatik bir şekilde çeşitli alanlara göre özelleştirilmiş endeks altyapısı oluşturulmasını sağlar. Bu endekslerde metin içeriklerden çıkartılmış varlıklar ve bu varlıklara ait RDF veri setlerinden elde edilen meta veri saklanır. Endekslenen bu verilerin üzerinde de kriter tabanlı arama, SPARQL sorguyla arama gibi arama yöntemleri sağlanır.

Metin içeriklerinin işlenmesiyle anlamsal zenginleşleştirmeler elde edildiğinden bahsettik. Bu ek bilgi ontoloji denilen veri yapılarında saklanır. Ontology Manager modülü bu veri yapılarının sorgulanması ve güncellenmesinin kolayca yapılabilmesi için servisler içerir.

Bu teknolojilerinin kullanımını örneklendirmek adına, Stanbol’un varlık tanıma mekanizmalarını metin içeriklerden sağlıkla ilgili hastalık, ilaç, yan etki gibi varlıkların tespit edilmesine yönelik ayarladık. Sonrasında, bir İYS üzerinden çeşitli dokümanlar çekerek, Stanbol’a aktardık ve oluşturduğumuz sağlıkla ilgili endekslere kaydedilmesini sağladık. Bu endekslerin üzerine sağlıkla ilgili çeşitli terimler kullanarak aramaların yapıldığı bir senaryo hazırladık.

Hazırladığımız senaryoyu içeren Stanbol kurulumunu burada bulabilirsiniz.

Ayrıca bu senaryoyla ilgili hazırladığımız Youtube videosunu da izleyebilirsiniz.

Ortaklar
1. Alkacon Software Almanya
2. Consiglio Nazionale delle Ricerche İtalya
3. Day Software İsviçre
4. Deutsche Forschungszentrum für Künstliche Intelligenz Almanya
5. Furtwangen University Almanya
6. Nemein Finlandiya
7. Nuxeo Fransa
8. Pisano Almanya
9. Polymedia İtalya
10. Salzburg Research Avusturya
11. SRDC Türkiye
12. University of Paderborn Almanya
13. University of St.Gallen İsviçre