DOI
10.34229/KCA2522-9664.25.3.13
УДК 004.318
О.В. ПАЛАГІН
Інститут кібернетики ім. В.М. Глушкова НАН України, Київ, Україна,
palagin_a@ukr.net
М.Г. ПЕТРЕНКО
Інститут кібернетики ім. В.М. Глушкова НАН України, Київ, Україна,
petrng@ukr.net
В.В. КАВЕРИНСЬКИЙ
Інститут кібернетики ім. В.М. Глушкова НАН України, Київ, Україна,
insamhlaithe@gmail.com
К.С. МАЛАХОВ
Інститут кібернетики ім. В.М. Глушкова НАН України, Київ, Україна,
k.malakhov@incyb.kiev.ua
МЕТОД ПІДВИЩЕННЯ ЕФЕКТИВНОСТІ
ОБРОБЛЕННЯ RDF/XML-СТРУКТУР У СЕРЕДОВИЩІ
APACHE JENA SEMANTIC WEB FRAMEWORK
Анотація. У статті досліджено вплив розбиття комп’ютерних OWL-онтологій (RDF/XML- структур великого розміру) та паралельного виконання запитів на продуктивність оброблення складних запитів. Результати дослідження показали, що розбиття онтологій, особливо у разі запитів із тривалим часом виконання, може суттєво скоротити час їхнього оброблення. Для запитів із середнім та тривалим часом виконання комбінація розбиття й паралелізації дає приріст продуктивності до 45 % порівняно з послідовним виконанням. Водночас для запитів із коротким часом виконання розбиття може спричиняти додаткові затримки, які частково компенсуються паралельним обробленням. Під час дослідження також з’ясовано, що у разі розбиття онтології на понад 7–10 частин подальше подрібнення не дає помітного підвищення продуктивності, роблячи такий підхід неефективним. У статті наголошено на важливості врахування надлишкових умов у запитах, особливо тих, що стосуються зв’язків між класами-предками та нащадками в межах онтології, оскільки їхнє вилучення чи оптимізація може суттєво прискорити оброблення. Представлено формальну модель, яка теоретично описує вплив розбиття онтології та паралелізації оброблення запитів на час їхнього виконання. Крім того, сформульовано формальні критерії, за допомогою яких визначають тип реакції запитів на розбиття онтології та їхнє паралельне виконання.
Ключові слова: онтологічна інженерія, Semantic Web, Apache Jena Semantic Web Framework, OWL, OWL-онтологія, RDF/XML-структура, RDF/XML, SPARQL, природномовні діалогові системи.
повний текст
СПИСОК ЛІТЕРАТУРИ
- 1. Nacer H., Aissani D. Semantic web services: Standards, applications, challenges and solutions. Journal of Network and Computer Applications. 2014. Vol. 44. P. 134–151. https://doi.org/10.1016/.
- 2. Ristoski P., Paulheim H. Semantic Web in data mining and knowledge discovery: A comprehensive survey. Journal of Web Semantics. 2016. Vol. 36. P. 1–22. https://doi.org/ 10.1016/.
- 3. DuCharme B. Learning SPARQL: Querying and updating with SPARQL 1.1. Beijing; Cambridge; Farnham; Kln; Sebastopol; Tokyo: O’Reilly Inc., 2013. 386 p.
- 4. SPARQL 1.1 Overview. https://www.w3.org/TR/.
- 5. Chebanyuk O. Software reuse approach based on review and analysis of reuse risks from projects uploaded to GitHub. In: Computer Science and Education in Computer Science. Zlateva T., Tuparov G. (Eds.). CSECS 2023. Lecture Notes of the Institute for Computer Sciences, Social Informatics and Telecommunications Engineering. 2023. Vol. 514. P. 144–155. https://doi.org/10.1007/.
- 6. Chebanyuk O. Investigation of drawbacks of the software development artifacts reuse approaches based on semantic analysis. In: Advances in Computer Science for Engineering and Education VI. Hu Z., Dychka I., He M. (Eds.). ICCSEEA 2023. Lecture Notes on Data Engineering and Communications Technologies. 2023. Vol. 181. P. 514–523. https://doi.org/10.1007/.
- 7. Chebanyuk O.V. An approach of text to model transformation of software models. Proc. 13th International Conference on Evaluation of Novel Approaches to Software Engineering ENASE (23-24 March 2018, Funchal, Madeira, Portugal). Funchal, 2018. P. 432–439. https://doi.org/10.5220/0006804504320439.
- 8. Opanasenko V.M., Fazilov S.K., Mirzaev O.N., Kakharov S.S. ugli. An ensemble approach to face recognition in access control systems. Journal of Mobile Multimedia. 2024. Vol. 20, Iss. 3. P. 749–768. https://doi.org/10.13052/jmm1550-4646.20310.
- 9. Apache Jena Semantic Web Framework. https://github.com/apache/jena. 2025.
- 10. Saleem M., Hasnain A., Ngonga Ngomo A.-C. LargeRDFBench: A billion triples benchmark for SPARQL endpoint federation. Journal of Web Semantics. 2018. Vol. 48. P. 85–125. https://doi.org/10.1016/.
- 11. Saleem M., Szїrnyas G., Conrads F., Bukhari S.A.C., Mehmood Q., Ngonga Ngomo A.-C. How representative is a SPARQL benchmark? An analysis of RDF triplestore benchmarks. Proc. WWW’19: The World Wide Web Conference (13–17 May 2019, San Francisco, CA, USA). San Francisco, 2019. P. 1623–1633. https://doi.org/10.1145/.
- 12. Katib A., Slavov V., Rao P. RIQ: Fast processing of SPARQL queries on RDF quadruples. Journal of Web Semantics. 2016. Vol. 37–38. P. 90–111. https://doi.org/10.1016/.
- 13. Guo Y., Pan Z., Heflin J. LUBM: A benchmark for OWL knowledge base systems. Journal of Web Semantics. 2005. Vol. 3, Iss. 2–3. P. 158–182. https://doi.org/10.1016/.
- 14. Li W., Wang S., Wu S., Gu Z., Tian Y. Performance benchmark on semantic web repositories for spatially explicit knowledge graph applications. Computers, Environment and Urban Systems. 2022. Vol. 98. Article number 101884. https://doi.org/10.1016/.
- 15. Palagin O.V., Kaverinskiy V.V., Petrenko M.G., Malakhov K.S. Digital health systems: Ontology-based universal dialog service for hybrid E-rehabilitation activities support. Proc. 2023 IEEE 12th International Conference on Intelligent Data Acquisition and Advanced Computing Systems: Technology and Applications (IDAACS) (07–09 September 2023, Dortmund, Germany). Dortmund, 2023. P. 84–89. https://doi.org/10.1109/.
- 16. Litvin A., Palagin O.V., Kaverinskiy V.V., Malakhov K.S. Ontology-driven development of dialogue systems. SACJ. 2023. Vol. 35, N 1. P. 37–62. https://doi.org/10.18489/.
- 17. Kaverinsky V.V., Malakhov K.S. Natural language-driven dialogue systems for support in physical medicine and rehabilitation. South African Computer Journal. 2023. Vol. 35, N 2. P. 119–126. https://doi.org/10.18489/.
- 18. Bakhshi M., Nematbakhsh M., Mohsenzadeh M., Rahmani A.M. Data-driven construction of SPARQL queries by approximate question graph alignment in question answering over knowledge graphs. Expert Systems with Applications. 2020. Vol. 146. Article number 113205. https://doi.org/10.1016/.
- 19. Almendros-JimБnez J.M., Becerra-TerЛn A. Discovery and diagnosis of wrong SPARQL queries with ontology and constraint reasoning. Expert Systems with Applications. 2021. Vol. 165. Article number 113772. https://doi.org/10.1016/.
- 20. Mosser M., Pieressa F., Reutte J.L., Soto A., D. Querying APIs with SPARQL. Information Systems. 2022. Vol. 105. Article number 101650. https://doi.org/10.1016/.
- 21. Naveen Kumar V., Ashok Kumar P.S. An efficient and scalable SPARQL query processing framework for big data using MapReduce and hybrid optimum load balancing. Data & Knowledge Engineering. 2023. Vol. 148. Article number 102239. https://doi.org/10.1016/.
- 22. Malakhov K.S., Vakulenko D., Kaverinskiy V.V. EBSCO articles dataset (domain knowledge: rehabilitation medicine) + JSON of every article. 2023. https://zenodo.org/record/ 8308214, https://doi.org/10.5281/ZENODO.8308214"target=_blank> https://doi.org/10.5281/ZENODO.8308214.
- 23. Palagin O.V., Kaverinskiy V.V., Litvin A., Malakhov K.S. OntoChatGPT information system: Ontology-driven structured prompts for ChatGPT meta-learning. IJC. 2023. Vol. 22, Iss. 2. P. 170–183. https://doi.org/10.47839/.
- 24. Litvin A.A., Velychko V.Yu., Kaverinskiy V.V. A new approach to automatic ontology generation from the natural language texts with complex inflection structures in the dialogue systems development. Proc. 13th International Scientific and Practical Conference from Programming UkrPROG’2022 (11–12 October 2022, Kyiv, Ukraine). Kyiv, 2022. P. 172–185. https://ceur-ws.org/.
- 25. Nakajima H., Miura J. Combining ontological knowledge and large language model for user-friendly service robots. arXiv:2410.16804v1 [cs.RO] 22 Oct 2024. https://doi.org/10.48550/.
- 26. GPT-4 Technical Report. arXiv:2303.08774v6 [cs.CL] 4 Mar 2024. https://doi.org/10.48550/.
- 27. OpenAI o1 System Card. 2024. https://cdn.openai.com/o1-system-card.pdf.
- 28. QwQ: Reflect Deeply on the Boundaries of the Unknown. 2025. https://qwenlm.github.io/ blog/.
- 29. DeepSeek-AI. DeepSeek-R1: Incentivizing reasoning capability in LLMs via reinforcement learning. arXiv:2501.12948v1 [cs.CL] 22 Jan 2025. https://doi.org/10.48550/.