Periodismo y web semántica
retos y propuesta de un periodismo estructurado mediante las 5 Ws
DOI:
https://doi.org/10.61283/r285fk77Palabras clave:
web semántica, periodismo estructurado, 5 W, big data, procesamiento del lenguaje naturalResumen
El Big Data y el Procesamiento del Lenguaje Natural abren nuevas vías de redacción, edición, clasificación, difusión y recuperación para los textos periodísticos. Sin embargo, el mundo académico le ha prestado aún una atención limitada frente a las aportaciones de otras áreas como la lingüística, la biblioteconomía y, obviamente, la informática. Sin embargo, el periodismo tiene mucho que ofrecer y que recibir de la web semántica. El presente trabajo presenta el estado de la cuestión más allá de las aportaciones del ámbito de la comunicación periodística, buscando elementos comunes entre ellas, para pasar después a exponer una forma de abordar el reto de estructurar la información periodística sin que esta resulte disruptiva o rompa con la tradición académica ni con la profesión –desde la teoría del discurso a los libros de estilo y la redacción–. Se propone acercar la web semántica a la práctica periodística utilizando las cinco Ws del periodismo como criterios de identificación y clasificación del contenido. Al utilizar las Ws del periodismo –Qué, Quién, Dónde, Cuándo, Cómo y Por Qué– como criterios de identificación y clasificación, el contenido quedaría organizado en torno a su significado –a su función semántica–, aprovechando las especificidades de la estructura narrativa de la noticia.
Descargas
Referencias
Agerri, R.; Artola, X.; Beloki, Z.; Rigau, G.; Soroa, A. (2015). Big data for Natural Language Processing: A streaming approach. Knowledge-Based Systems, 79, 36-42. http://dx.doi.org/10.1016/j.knosys.2014.11.007
Alvite, M.L. (2012). El uso de vocabularios controlados en los sistemas de información jurídica: evolución y tendencias actuales de representación. Scire. Representación y Organización del Conocimiento, 18(1): 29-39.
https://www.ibersid.eu/ojs/index.php/scire/article/view/3973
Arakaki, F.; Coneglian, C.; Santos, P.; Santarém, J. (2019). Disponibilidad de metadatos en linked data para repositorios digitales. Anales de Documentación, 22(2). http://dx.doi.org/10.6018/analesdoc.32744
Barba, C.; García-Nieto, J.; Navas-Delgado, I.; Aldana-Montes, J.F. (2016). A fine grain sentiment analisis with semantics in Tweets. International Journal of Interactive Multimedia and Artificial Intelligence, 3(6): 22-28.
http://dx.doi.org/10.9781/ijimai.2016.363
Baviera, T. (2017). Técnicas para el análisis de sentimiento en Twitter: Aprendizaje automático supervisado y SentiStrengh. Dígitos, 3: 33-50. http://dx.doi.org/10.7203/rd.v1i3.74
Beltrán, P. (2015). La documentación informativa y la recuperación de la información escrita. Nuevas competencias para el ciberespacio. Index.comunicación, 5(3): 29-57. http://hdl.handle.net/10115/15458
Berners-Lee, T. (2000). Tejiendo la red. Siglo XXI.
Berners-Lee, T.; Hendler J., y Lassila, O. (2001). The semantic web. Scientific American, mayo 2001, 29-37. https://www-sop.inria.fr/acacia/cours/essi2006/scientific%20american_%20feature%20article_%20the%20semantic%20web_%20may%202001.pdf
Bueno, M.R. (2000). Estructura textual, macroestructura semántica y superestructura formal de la noticia. Estudios sobre el Mensaje Periodístico, 6: 239-258. https://revistas.ucm.es/index.php/ESMP/article/download/ESMP0000110239A/0/0
Casas, J.; Nin, J; Julbe, F. (2019). Big Data: Análisis de datos en entornos masivos. UOC.
Casasús, J.M.; Núñez Ladevéze, L. (1991) Estilo y géneros periodísticos. Ariel.
Codina, L. (2016). Tres dimensiones del periodismo computacional. Intersecciones con las ciencias de la documentación. Anuario ThinkEPI, 10: 200-202. http://dx.doi.org/10.3145/thinkepi.2016.41
Colle, R. (2013). Prensa y ‘Big Data’: El desafío de la acumulación y análisis de datos. Revista Mediterránea de Comunicación, 4 (1): 1-8. https://doi.org/10.14198/MEDCOM2013.4.1.13
Conroy, N.; Rubin, V.; Chen, Y. (2016). Automatic deception detection: Methods for finding fake news. Proceedings of the Association for Information Science and Technology, 52(1): 1-4. https://doi.org/10.1002/pra2.2015.145052010082
Córdoba-Cabús, A; Hidalgo-Arjona, M; López-Martín, Á. (2021). Cobertura de diarios en Twitter de las elecciones autonómicas de Madrid 2021. Procesamiento de lenguaje natural y algoritmos de aprendizaje automático. Profesional de la Información, 30 (6). https://doi.org/10.3145/epi.2021.nov.11
Criado, J.I.; Villodre, J. (2018). Comunicando datos masivos del sector público local en redes sociales. Análisis de sentimiento en Twitter. El Profesional de la Información, 27(3): 614-623. https://doi.org/10.3145/epi.2018.may.14
Dovifat, E. (1960). Periodismo. Vols. 1 y 2. Uthera.
Drndarevic, B.; Saggion, H. (2012). Reducing text complexity through automatic lexical simplification: an empirical study for spanish. Procesamiento del Lenguaje Natural, 49: 13-20.
http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/4555
Fermoso-García, A.; Manzano-García, M.I.; Mateos-Sánchez, M.; Hernández, C. (2018). Sistema de modelado semántico para la catalogación, clasificación, consulta y publicación en abierto de información bibliográfica. El Profesional de la Información, 27(2): 410-418. https://doi.org/10.3145/epi.2018.mar.20
Fontuberta, M. de (2003) La noticia. Pistas para percibir el mundo. Paidós.
Freixa, P; Pérez-Montoro, M.; Codina. L. (2017). Interacción y divulgación de datos en el periodismo estructurado. El Profesional de la Información, 26(6): 1076-1090. https://doi.org/10.3145/epi.2017.nov.07
García, A. (2004). Instrumentos de representación del conocimiento: tesauros versus ontologías. Anales de Documentación, 7: 79-95. https://revistas.um.es/analesdoc/article/view/1691
García, A. (2014). Análisis documental de noticias de prensa en sistemas de información factual. Revista Española de Documentación Científica, 37(2):e046. http://dx.doi.org/10.3989/redc.2014.2.1094
García, A. (2016). Organización del conocimiento para la documentación en periodismo. Situación y prospectiva. Scire. Representación y Organización del Conocimiento, 22(2): 21-28. https://dialnet.unirioja.es/servlet/articulo?codigo=5713295
García, A.; Rodríguez, D.; Catalina, B. (2019). Estudio sobre la indización/etiquetado y los lenguajes documentales en cinco diarios españoles. Scire. Representación y Organización del Conocimiento, 25(1): 55-64.
https://ojs.ibersid.eu/index.php/scire/article/view/4579
Gomis, S. (2015). Publicar datos abiertos enlazados (LOD) en entornos bibliotecarios mediante el gestor de contenidos semántico Ximdex. Cuadernos de Gestión de Información, 5(1): 1-17. https://revistas.um.es/gesinfo/article/view/232181
González-Arias, C.; López-García, X. (2023). ChatGPT: Stream of opinion in five newspapers in the first 100 days since its launch. Profesional De La información, 32(5). https://doi.org/10.3145/epi.2023.sep.24
Grijelmo, A. (1997). El estilo del periodista. Taurus.
Gutiérrez-Caneda, B; Vázquez-Herrero, J.; López-García, X. (2023). AI application in journalism: ChatGPT and the uses and risks of an emergent technology. Profesional De La información, 32(5). https://doi.org/10.3145/epi.2023.sep.14
Hernando, A. (2015). El discurso periodístico en el reportaje de prensa. Signa: Revista de la Asociación Española de Semiótica, 24: 375-392 http://www.cervantesvirtual.com/descargapdf/el-discurso-periodistico-en-el-reportaje-de-prensa/
Lloret, E.; Palomar, M. (2011). COMPENDIUM: Una herramienta de generación de resúmenes modular. Procesamiento de Lenguaje Natural, 47:107-115. http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/955
Marcos, J.C.; Edo, C. (2015). Análisis de la nueva perspectiva de la documentación periodística en los medios de comunicación españoles. Revista General de Información y Documentación, 25(2): 389-423.
http://dx.doi.org/10.5209/rev_RGID.2015.v25.n2.51235
Martín, G. (1987). Géneros periodísticos. Paraninfo.
Martínez Albertos, J.L. (1991). Curso general de redacción periodística. Paraninfo.
Martínez, M.M.; Alvite, M.L. (2014). Propuesta metodológica de evaluación de gestores de tesauros compatibles con la web semántica. Anales de Documentación, 17(1): 1-18. https://doi.org/10.6018/analesdoc.17.1.186271
Mas, L. (2016a). Estructura formal, textual y oral del discurso público. Estudios sobre el Mensaje Periodístico, 22(1): 445-461. https://doi.org/10.5209/rev_esmp.2016.v22.n1.52606
Mas, L. (2016b) Caracterización prosódica del inicio, desarrollo y final de la noticia. Revista Española de Lingüística Aplicada, 29(1): 212-237. DOI: https://doi.org/10.1075/resla.29.1.09mas
Mateo, P.L.; González, J.C.; Villena, J.; Martínez, J.L. (2003). Un sistema para resumen automático de textos en castellano. Procesamiento del Lenguaje Natural, 31: 29-36. http://hdl.handle.net/10045/1486
Mungra, P.; Calziani, T. (2013). Lexicographic studies in medicine: Academic World List for clinical case histories. Ibérica: Revista de la Asociación Europea de Lenguas para Fines Específicos (AELFE), 25: 39-62.
https://dialnet.unirioja.es/servlet/articulo?codigo=4276659
Parratt, S. (2017). Manual práctico de redacción periodística. Síntesis.
Passos, A.; Kumar, V.; McCallum, A. (2014). Lexicon Infused Phrase Embeddings for Named Entity Resolution. Association for Computational Linguistics: 78-86. https://doi.org/10.3115/v1/W14-1609
Pedraza, R.; Codina, L.; Rovira, C. (2007). Web semántica y ontologías en el procesamiento de la información documental. El Profesional de la Información, 16(6): 569-579. https://doi.org/10.3145/epi.2007.nov.04
Pérez, A.; Casillas, A.; Gojenola, K.; Oroz, M.; Aguirre, N.; Amillano, E. (2014). The aid of machine learning to overcome the classification of real health discharge reports written in Spanish. Procesamiento del Lenguaje Natural, 53: 77-84. http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/5048
Pérez, M.A.; Cardoso, A.C. (2014). Técnicas de extracción de entidades con nombre. Inteligencia artificial, 17(53): 3-12. https://www.redalyc.org/pdf/925/92530455002.pdf
Pérez-Rosas, V.; Kleinberg, B.; Mihalcena, R. (2018). Automatic Detection of Fake News. Proceedings of the 27th International Conference on Computational Linguistics, 3391-3401. https://www.aclweb.org/anthology/C18-1287.pdf
Plaza, L.; Díaz, A. (2011). Using semantic graphs and word sense disambiguation techniques to improve text summarization. Procesamiento del Lenguaje Natural, 47: 97-105.
http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/956
Quesada, M. (2007). Periodismo de sucesos. Síntesis.
Ratinov, L.; Roth, D. (2009). Design Challenges and Misconceptions in Named Entity Recognition. Association for Computational Linguistics. Proceedings of the Thirteenth Conference on Computational Natural Language Learning (CoNLL-2009): 147-155. https://www.aclweb.org/anthology/W09-1119.pdf
Rodríguez, L. (2019). Desinformación: retos profesionales para el sector de la comunicación. El Profesional de la Información, 28(3). https://doi.org/10.3145/epi.2019.may.06
Rodríguez, T. (2013). Perspectivas en el análisis de la relación entre gramática y discurso: estructura periférica y conexiones entre oraciones. Círculo de Lingüística Aplicada a la Comunicación, 55, 3. https://doi.org/10.5209/rev_clac.2013.v55.43263
Sánchez, R.; Gil, B. (2007). Lenguajes documentales y ontologías. El Profesional de la Información, 16(6): 551-560. https://doi.org/10.3145/epi.2007.nov.02
Sancho, A.; Fernández, C.; Boulat, P. (2012). La búsqueda de información jurídica: de los tesauros a la inteligencia artificial.
Scire: Representación y Organización del Conocimiento, 18(1): 73-83. https://www.ibersid.eu/ojs/index.php/scire/article
/view/3942
Szostak, R. (2014). Advances in Classification Research Online 2013. Classification, Ontology, and the Semantic Web. Advances In Classification Research Online, 24(1): 30-37. http://dx.doi.org/10.7152/acro.v24i1.14674
Túñez-López, M.; Toural-Bran, C.; Cacheiro-Requieijo, S. (2018). Uso de bots y algoritmos para automatizar la redacción de noticias: percepción y actitudes de los periodistas en España. El Profesional de la Información, 27(4): 750-758. https://doi.org/10.3145/epi.2018.jul.04
Túñez-López, M.; Toural-Bran, C.; Valdiviezo-Abad, C. (2019). Automatización, bots y algoritmos en la redacción de noticias. Impacto y calidad del periodismo artificial. Revista Latina de Comunicación Social, 74(12): 1411-1433.
http://dx.doi.org/10.4185/RLCS-2018-1391
Ufarte, M.J.; Peralta, L.; Murcia-Verdú, F.J. (2018). Fact checking: un nuevo desafío del periodismo. El Profesional de la Información, 27(4): 733-741
Van Dijk, T. (1980). Texto y contexto. Cátedra.
Van Dijk, T. (1990). La noticia como discurso. Comprensión, estructura y producción de la información. Paidós.
Vera, A. (2012). El párrafo como unidad discursiva. Estudios de lingüística, 26: 343-358. http://hdl.handle.net/10045/28733
Warren, C. (1975). Géneros periodísticos informativos. ATE.
Descargas
Publicado
Número
Sección
Licencia
Derechos de autor 2024 Aingeru Genaut (Autor/a)
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
Política de acceso abierto
Se permite el acceso libre y abierto de cualquier interesado a todos los contenidos de los números de la revista, sin costo alguno, pudiendo imprimir y trasladar todos los artículos, con la única condición de precisar la fuente y la autoría.
La revista: a) no cobra a las autorías costes por el procesamiento de los artículos ni por el envío de los mismos, b) mantiene el copyright para los autores sin restricciones, c) facilita a los autores conservar sus derechos de publicación sin limitaciones.
La Revista Internacional de Investigación y Transferencia en Comunicación y Ciencias Sociales (INTRACOM) es una obra original gestionada por Activa 19 Comunicaciones. Todos los artículos incluidos en la Revista son obra original de sus respectivas autorías. Esta Revista se ofrece libremente a la comunidad científica y académica sin coste alguno y libera los contenidos de acuerdo a la licencia "Reconocimiento-NoComercial-CompartirIgual 4.0 CC BY-NC-SA" del proyecto Creative Commons dispuesta en la siguiente url: https://creativecommons.org/licenses/by-nc-sa/4.0/legalcode