Identifying the urban space for locals and tourists through “Foursquare” data in Barcelona

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/91556
Información del item - Informació de l'item - Item information
Title: Identifying the urban space for locals and tourists through “Foursquare” data in Barcelona
Other Titles: Identificación del espacio urbano por residentes y turistas, a través de datos de “Foursquare” en Barcelona
Authors: Yang, Liya | Marmolejo Duarte, Carlos Ramiro | Martí Ciriquián, Pablo
Research Group/s: Urbanística y Ordenación del Territorio en el Espacio Litoral
Center, Department or Service: Universidad de Alicante. Departamento de Edificación y Urbanismo
Keywords: Tourism | Urban space | LBSN | Land uses | Turismo | Espacio urbano | Usos del suelo
Knowledge Area: Urbanística y Ordenación del Territorio
Issue Date: 2018
Publisher: Centre de Politica de Sol i Valoracions, CPSV / Universitat Politècnica de Catalunya, UPC
Citation: YANG, L. et al. Identifying the urban space for locals and tourists through “Foursquare” data in Barcelona. En: Libro de proceedings, CTV 2018. XII Congreso Internacional Ciudad y Territorio Virtual. “Ciudades y Territorios Inteligentes”. UNCuyo, Mendoza, 5-7 septiembre 2018. Barcelona: CPSV, 2018, p. 143-164
Abstract: Barcelona is an important touristic city in the world. According to Annual Report of Tourism of Barcelona (2014), more than 7.5 million tourists visited here in that year. The studies related to tourism of Barcelona are numerous; however, the comparison of activities and land uses between tourists and locals is scarcely analyzed. In fact, tourism may be a dominant factor of urban development as well as a source of social conflict. Therefore, it is crucial to understand the co-living situation of tourists and residents in a touristic city. The main objective of the study is to identify touristic users and local users through their Foursquare behaviors. Furthermore, it explores the difference of geospatial activities and POIs’ usages between the two groups. The analytical period is from April of 2012 to September of 2013, based on the monitoring span of Foursquare data. After filtration, the total check-ins during this period is 80,936 coming from 4,250 Foursquare users. The POIs of Foursquare are 13,887 in Barcelona. The geographic range of data roughly covers the central conurbation of the Metropolitan area of Barcelona. The methodology includes four parts. The first step is to select indicators of behavior and standardization. The second step consists of selecting two short-period samples and classifying them into tourists and locals by K-means clustering. After the manual examination of the initial result, a threshold of classification is introduced to improve the result. Finally, the same method of identification is applied to the whole dataset. According to the result, the difference of POI usages verifies that the identification is effective. It reflects the typical activities of tourists and locals separately in the city. The most visited POIs of tourists are: outdoor resorts, transport, restaurants, hotel, and store. The corresponding rank of locals is restaurants, workplaces, outdoor resorts, educational places, and transport. Moreover, the two groups appear different Foursquare behaviors, regardless of the length of analyzing period. In general, behaviors of tourists -- the stay duration, number of check-ins, and total travel distance, are smaller than the local group. K-means clustering can effectively identify users who possess the extreme values of attributes. However, it is unavoidable to introduce artificial intervention for users without extreme-characteristics. Besides, the geospatial distribution and active time also embody differences between locals and tourists. In terms of movement scale, tourists seem more concentrated than the residents. With regard to the active time, tourists’ active period is similar every day. On the contrary, locals show an evident periodic variation daily and weekly. It is undeniable that this paper has several limitations. Firstly, Foursquare data has bias. The high proportion of check-ins is restaurants because Foursquare aims to provide practical information about places for users. What’s more, the lack of demographic information of users also limits the scope of the study, due to the privacy policy. In sum, this study demonstrates that it is possible to distinguish tourists from locals via Foursquare data, though the uncertainty of data is recognized. How to improve the accuracy of the unsupervised identification and cooperate with other datasets will be the object of further investigation. Furthermore, whether the identification model can be universally applied is another issue that is worth to test in the future. | Barcelona es una importante ciudad turística en el mundo. Según el Informe Anual de Turismo de Barcelona (2014), más de 7,5 millones de turistas la visitaron este año. Los estudios relacionados con el turismo en Barcelona son numerosos, sin embargo, la comparación de actividades y usos del espacio entre turistas y residentes es poco analizada. De hecho, el turismo puede ser un factor dominante del desarrollo urbano, así como una fuente de conflicto social. Por lo tanto, es crucial comprender la situación de convivencia de turistas y residentes en una ciudad turística. El objetivo principal del estudio es identificar usuarios turísticos y usuarios locales a través de sus comportamientos de Foursquare. Además, explora la diferencia entre las actividades geoespaciales y los usos de los puntos de interés (POIs) entre los dos grupos. El período analizado abarca desde abril de 2012 a septiembre de 2013, según el intervalo de monitoreo de los datos de Foursquare. Después de la filtración, el total de los registros durante este período son 80,936 provenientes de 4,250 usuarios de Foursquare. Los POIs de Foursquare son 13,887 en Barcelona. El rango geográfico de los datos cubre aproximadamente la conurbación central del área metropolitana de Barcelona. La metodología incluye cuatro partes. El primer paso es seleccionar indicadores de comportamiento y estandarización. El segundo paso consiste en seleccionar dos muestras de corto período y clasificarlas en turistas y locales por agrupación de K-means. Después del examen manual del resultado inicial, se introduce un umbral de clasificación para mejorar el resultado. Finalmente, el mismo método de identificación se aplica a todo el conjunto de datos. De acuerdo con el resultado, la diferencia de uso de POIs verifica que la identificación sea efectiva, reflejando las actividades típicas de turistas y residentes por separado en la ciudad. Los POIs más visitados de los turistas son: complejos turísticos al aire libre, transporte, restaurantes, hoteles y tiendas. El rango correspondiente de los residentes es: restaurantes, lugares de trabajo, centros turísticos al aire libre, lugares educativos y transporte. Además, independientemente de la duración del período de análisis, los dos grupos tienen diferentes comportamientos de Foursquare. En general, los comportamientos de los turistas: la duración de la estadía, el número de registros y la distancia total de viaje son menores que los del grupo de locales. El cluster de K-means puede identificar efectivamente a los usuarios que poseen los valores extremos de los atributos. Sin embargo, es inevitable introducir una intervención artificial para usuarios sin características extremas. Además, la distribución geoespacial y el tiempo activo también representan diferencias entre los lugareños y los turistas. En términos de escala de movimiento, los turistas parecen más concentrados que los residentes. Con respecto al tiempo activo, el período activo de los turistas es similar todos los días. Por el contrario, los residentes muestran una evidente variación periódica diaria y semanal. Es innegable que este trabajo presenta limitaciones. En primer lugar, los datos de Foursquare tienen sesgo. La alta proporción de check-ins en restaurantes es producto de que Foursquare tiene como objetivo proporcionar información práctica sobre los lugares para los usuarios. Además, la falta de información demográfica de los usuarios también limita el alcance del estudio, debido a su política de privacidad. En resumen, este estudio demuestra que es posible distinguir a los turistas de los residentes a través de los datos de Foursquare, aunque se reconoce la incertidumbre de los datos. Cómo mejorar la precisión de la identificación no supervisada y cooperar con otros conjuntos de datos será objeto de investigación adicional. Además, si el modelo de identificación puede aplicarse universalmente es otro tema que vale la pena probar en el futuro.
URI: http://hdl.handle.net/10045/91556
ISBN: 978-84-8157-661-0
Language: eng
Type: info:eu-repo/semantics/conferenceObject
Rights: Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0
Peer Review: si
Publisher version: http://hdl.handle.net/2117/132258
Appears in Collections:INV - UOTEL - Comunicaciones a Congresos, Conferencias, etc.

Files in This Item:
Files in This Item:
File Description SizeFormat 
Thumbnail2018_Yang_etal_CTV.pdf1,25 MBAdobe PDFOpen Preview


This item is licensed under a Creative Commons License Creative Commons