Journalism and semantic web

challenges and proposal of a structured journalism through the 5 Ws

Authors

  • Aingeru Genaut Author

DOI:

https://doi.org/10.61283/r285fk77

Keywords:

Semantic web, structured journalism, 5W, big data, natural language processing

Abstract

Big Data and Natural Language Processing offer new ways of writing, editing, classifying, diffusion and retrieving journalistic texts. However, the academic world has still paid limited attention to it, compared to the contributions of other areas such as linguistics, library sciences and, obviously, computer sciences. However, journalism has much to offer – and to receive – from the semantic web. The present work presents the state of the question beyond the contributions of the field of journalistic communication, looking for common elements between them, to then go on to expose a way of approaching the challenge of structuring journalistic information without it being disruptive or breaking neither with the academic tradition nor with the profession –from discourse theory to style books and writing–. It is proposed to bring the semantic web closer to journalistic practice using the five Ws of journalism as criteria for identifying and classifying content. Using the Ws of journalism –What, Who, Where, When, How and Why– as identification and classification criteria, the content would be organized around its meaning –its semantic function–, taking advantage of the specificities of the narrative structure of the news.

Downloads

Download data is not yet available.

References

Agerri, R.; Artola, X.; Beloki, Z.; Rigau, G.; Soroa, A. (2015). Big data for Natural Language Processing: A streaming approach. Knowledge-Based Systems, 79, 36-42. http://dx.doi.org/10.1016/j.knosys.2014.11.007

Alvite, M.L. (2012). El uso de vocabularios controlados en los sistemas de información jurídica: evolución y tendencias actuales de representación. Scire. Representación y Organización del Conocimiento, 18(1): 29-39.

https://www.ibersid.eu/ojs/index.php/scire/article/view/3973

Arakaki, F.; Coneglian, C.; Santos, P.; Santarém, J. (2019). Disponibilidad de metadatos en linked data para repositorios digitales. Anales de Documentación, 22(2). http://dx.doi.org/10.6018/analesdoc.32744

Barba, C.; García-Nieto, J.; Navas-Delgado, I.; Aldana-Montes, J.F. (2016). A fine grain sentiment analisis with semantics in Tweets. International Journal of Interactive Multimedia and Artificial Intelligence, 3(6): 22-28.

http://dx.doi.org/10.9781/ijimai.2016.363

Baviera, T. (2017). Técnicas para el análisis de sentimiento en Twitter: Aprendizaje automático supervisado y SentiStrengh. Dígitos, 3: 33-50. http://dx.doi.org/10.7203/rd.v1i3.74

Beltrán, P. (2015). La documentación informativa y la recuperación de la información escrita. Nuevas competencias para el ciberespacio. Index.comunicación, 5(3): 29-57. http://hdl.handle.net/10115/15458

Berners-Lee, T. (2000). Tejiendo la red. Siglo XXI.

Berners-Lee, T.; Hendler J., y Lassila, O. (2001). The semantic web. Scientific American, mayo 2001, 29-37. https://www-sop.inria.fr/acacia/cours/essi2006/scientific%20american_%20feature%20article_%20the%20semantic%20web_%20may%202001.pdf

Bueno, M.R. (2000). Estructura textual, macroestructura semántica y superestructura formal de la noticia. Estudios sobre el Mensaje Periodístico, 6: 239-258. https://revistas.ucm.es/index.php/ESMP/article/download/ESMP0000110239A/0/0

Casas, J.; Nin, J; Julbe, F. (2019). Big Data: Análisis de datos en entornos masivos. UOC.

Casasús, J.M.; Núñez Ladevéze, L. (1991) Estilo y géneros periodísticos. Ariel.

Codina, L. (2016). Tres dimensiones del periodismo computacional. Intersecciones con las ciencias de la documentación. Anuario ThinkEPI, 10: 200-202. http://dx.doi.org/10.3145/thinkepi.2016.41

Colle, R. (2013). Prensa y ‘Big Data’: El desafío de la acumulación y análisis de datos. Revista Mediterránea de Comunicación, 4 (1): 1-8. https://doi.org/10.14198/MEDCOM2013.4.1.13

Conroy, N.; Rubin, V.; Chen, Y. (2016). Automatic deception detection: Methods for finding fake news. Proceedings of the Association for Information Science and Technology, 52(1): 1-4. https://doi.org/10.1002/pra2.2015.145052010082

Córdoba-Cabús, A; Hidalgo-Arjona, M; López-Martín, Á. (2021). Cobertura de diarios en Twitter de las elecciones autonómicas de Madrid 2021. Procesamiento de lenguaje natural y algoritmos de aprendizaje automático. Profesional de la Información, 30 (6). https://doi.org/10.3145/epi.2021.nov.11

Criado, J.I.; Villodre, J. (2018). Comunicando datos masivos del sector público local en redes sociales. Análisis de sentimiento en Twitter. El Profesional de la Información, 27(3): 614-623. https://doi.org/10.3145/epi.2018.may.14

Dovifat, E. (1960). Periodismo. Vols. 1 y 2. Uthera.

Drndarevic, B.; Saggion, H. (2012). Reducing text complexity through automatic lexical simplification: an empirical study for spanish. Procesamiento del Lenguaje Natural, 49: 13-20.

http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/4555

Fermoso-García, A.; Manzano-García, M.I.; Mateos-Sánchez, M.; Hernández, C. (2018). Sistema de modelado semántico para la catalogación, clasificación, consulta y publicación en abierto de información bibliográfica. El Profesional de la Información, 27(2): 410-418. https://doi.org/10.3145/epi.2018.mar.20

Fontuberta, M. de (2003) La noticia. Pistas para percibir el mundo. Paidós.

Freixa, P; Pérez-Montoro, M.; Codina. L. (2017). Interacción y divulgación de datos en el periodismo estructurado. El Profesional de la Información, 26(6): 1076-1090. https://doi.org/10.3145/epi.2017.nov.07

García, A. (2004). Instrumentos de representación del conocimiento: tesauros versus ontologías. Anales de Documentación, 7: 79-95. https://revistas.um.es/analesdoc/article/view/1691

García, A. (2014). Análisis documental de noticias de prensa en sistemas de información factual. Revista Española de Documentación Científica, 37(2):e046. http://dx.doi.org/10.3989/redc.2014.2.1094

García, A. (2016). Organización del conocimiento para la documentación en periodismo. Situación y prospectiva. Scire. Representación y Organización del Conocimiento, 22(2): 21-28. https://dialnet.unirioja.es/servlet/articulo?codigo=5713295

García, A.; Rodríguez, D.; Catalina, B. (2019). Estudio sobre la indización/etiquetado y los lenguajes documentales en cinco diarios españoles. Scire. Representación y Organización del Conocimiento, 25(1): 55-64.

https://ojs.ibersid.eu/index.php/scire/article/view/4579

Gomis, S. (2015). Publicar datos abiertos enlazados (LOD) en entornos bibliotecarios mediante el gestor de contenidos semántico Ximdex. Cuadernos de Gestión de Información, 5(1): 1-17. https://revistas.um.es/gesinfo/article/view/232181

González-Arias, C.; López-García, X. (2023). ChatGPT: Stream of opinion in five newspapers in the first 100 days since its launch. Profesional De La información, 32(5). https://doi.org/10.3145/epi.2023.sep.24

Grijelmo, A. (1997). El estilo del periodista. Taurus.

Gutiérrez-Caneda, B; Vázquez-Herrero, J.; López-García, X. (2023). AI application in journalism: ChatGPT and the uses and risks of an emergent technology. Profesional De La información, 32(5). https://doi.org/10.3145/epi.2023.sep.14

Hernando, A. (2015). El discurso periodístico en el reportaje de prensa. Signa: Revista de la Asociación Española de Semiótica, 24: 375-392 http://www.cervantesvirtual.com/descargapdf/el-discurso-periodistico-en-el-reportaje-de-prensa/

Lloret, E.; Palomar, M. (2011). COMPENDIUM: Una herramienta de generación de resúmenes modular. Procesamiento de Lenguaje Natural, 47:107-115. http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/955

Marcos, J.C.; Edo, C. (2015). Análisis de la nueva perspectiva de la documentación periodística en los medios de comunicación españoles. Revista General de Información y Documentación, 25(2): 389-423.

http://dx.doi.org/10.5209/rev_RGID.2015.v25.n2.51235

Martín, G. (1987). Géneros periodísticos. Paraninfo.

Martínez Albertos, J.L. (1991). Curso general de redacción periodística. Paraninfo.

Martínez, M.M.; Alvite, M.L. (2014). Propuesta metodológica de evaluación de gestores de tesauros compatibles con la web semántica. Anales de Documentación, 17(1): 1-18. https://doi.org/10.6018/analesdoc.17.1.186271

Mas, L. (2016a). Estructura formal, textual y oral del discurso público. Estudios sobre el Mensaje Periodístico, 22(1): 445-461. https://doi.org/10.5209/rev_esmp.2016.v22.n1.52606

Mas, L. (2016b) Caracterización prosódica del inicio, desarrollo y final de la noticia. Revista Española de Lingüística Aplicada, 29(1): 212-237. DOI: https://doi.org/10.1075/resla.29.1.09mas

Mateo, P.L.; González, J.C.; Villena, J.; Martínez, J.L. (2003). Un sistema para resumen automático de textos en castellano. Procesamiento del Lenguaje Natural, 31: 29-36. http://hdl.handle.net/10045/1486

Mungra, P.; Calziani, T. (2013). Lexicographic studies in medicine: Academic World List for clinical case histories. Ibérica: Revista de la Asociación Europea de Lenguas para Fines Específicos (AELFE), 25: 39-62.

https://dialnet.unirioja.es/servlet/articulo?codigo=4276659

Parratt, S. (2017). Manual práctico de redacción periodística. Síntesis.

Passos, A.; Kumar, V.; McCallum, A. (2014). Lexicon Infused Phrase Embeddings for Named Entity Resolution. Association for Computational Linguistics: 78-86. https://doi.org/10.3115/v1/W14-1609

Pedraza, R.; Codina, L.; Rovira, C. (2007). Web semántica y ontologías en el procesamiento de la información documental. El Profesional de la Información, 16(6): 569-579. https://doi.org/10.3145/epi.2007.nov.04

Pérez, A.; Casillas, A.; Gojenola, K.; Oroz, M.; Aguirre, N.; Amillano, E. (2014). The aid of machine learning to overcome the classification of real health discharge reports written in Spanish. Procesamiento del Lenguaje Natural, 53: 77-84. http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/5048

Pérez, M.A.; Cardoso, A.C. (2014). Técnicas de extracción de entidades con nombre. Inteligencia artificial, 17(53): 3-12. https://www.redalyc.org/pdf/925/92530455002.pdf

Pérez-Rosas, V.; Kleinberg, B.; Mihalcena, R. (2018). Automatic Detection of Fake News. Proceedings of the 27th International Conference on Computational Linguistics, 3391-3401. https://www.aclweb.org/anthology/C18-1287.pdf

Plaza, L.; Díaz, A. (2011). Using semantic graphs and word sense disambiguation techniques to improve text summarization. Procesamiento del Lenguaje Natural, 47: 97-105.

http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/956

Quesada, M. (2007). Periodismo de sucesos. Síntesis.

Ratinov, L.; Roth, D. (2009). Design Challenges and Misconceptions in Named Entity Recognition. Association for Computational Linguistics. Proceedings of the Thirteenth Conference on Computational Natural Language Learning (CoNLL-2009): 147-155. https://www.aclweb.org/anthology/W09-1119.pdf

Rodríguez, L. (2019). Desinformación: retos profesionales para el sector de la comunicación. El Profesional de la Información, 28(3). https://doi.org/10.3145/epi.2019.may.06

Rodríguez, T. (2013). Perspectivas en el análisis de la relación entre gramática y discurso: estructura periférica y conexiones entre oraciones. Círculo de Lingüística Aplicada a la Comunicación, 55, 3. https://doi.org/10.5209/rev_clac.2013.v55.43263

Sánchez, R.; Gil, B. (2007). Lenguajes documentales y ontologías. El Profesional de la Información, 16(6): 551-560. https://doi.org/10.3145/epi.2007.nov.02

Sancho, A.; Fernández, C.; Boulat, P. (2012). La búsqueda de información jurídica: de los tesauros a la inteligencia artificial.

Scire: Representación y Organización del Conocimiento, 18(1): 73-83. https://www.ibersid.eu/ojs/index.php/scire/article

/view/3942

Szostak, R. (2014). Advances in Classification Research Online 2013. Classification, Ontology, and the Semantic Web. Advances In Classification Research Online, 24(1): 30-37. http://dx.doi.org/10.7152/acro.v24i1.14674

Túñez-López, M.; Toural-Bran, C.; Cacheiro-Requieijo, S. (2018). Uso de bots y algoritmos para automatizar la redacción de noticias: percepción y actitudes de los periodistas en España. El Profesional de la Información, 27(4): 750-758. https://doi.org/10.3145/epi.2018.jul.04

Túñez-López, M.; Toural-Bran, C.; Valdiviezo-Abad, C. (2019). Automatización, bots y algoritmos en la redacción de noticias. Impacto y calidad del periodismo artificial. Revista Latina de Comunicación Social, 74(12): 1411-1433.

http://dx.doi.org/10.4185/RLCS-2018-1391

Ufarte, M.J.; Peralta, L.; Murcia-Verdú, F.J. (2018). Fact checking: un nuevo desafío del periodismo. El Profesional de la Información, 27(4): 733-741

Van Dijk, T. (1980). Texto y contexto. Cátedra.

Van Dijk, T. (1990). La noticia como discurso. Comprensión, estructura y producción de la información. Paidós.

Vera, A. (2012). El párrafo como unidad discursiva. Estudios de lingüística, 26: 343-358. http://hdl.handle.net/10045/28733

Warren, C. (1975). Géneros periodísticos informativos. ATE.

Downloads

Published

2024-07-06

Issue

Section

Articles

How to Cite

Genaut, Aingeru. 2024. “Journalism and Semantic Web: Challenges and Proposal of a Structured Journalism through the 5 Ws”. International Journal of Research and Transfer in Communication and Social Sciences 3 (1): 14-31. https://doi.org/10.61283/r285fk77.

Similar Articles

1-10 of 26

You may also start an advanced similarity search for this article.