Using the Web to Predict Regional Trade Flows: Data Extraction, Modeling, and Validation

Emmanouil Tranos, Andre Carrascal Incera, George Willis

Research output: Contribution to journalArticle (Academic Journal)peer-review

66 Downloads (Pure)

Abstract

Despite the importance of interregional trade for building effective regional economic policies, there are very few hard data to illustrate such interdependencies. We propose here a novel research framework to predict interregional trade flows by utilizing freely available Web data and machine learning algorithms. Specifically, we extract hyperlinks between archived Websites in the United Kingdom and we aggregate these data to create an interregional network of hyperlinks between geolocated and commercial Web pages over time. We also use existing interregional trade data to train our models using random forests and then make out-of-sample predictions of interregional trade flows using a rolling-forecasting framework. Our models illustrate great predictive capability with R2 greater than 0.9. We are also able to disaggregate our predictions in terms of industrial sectors, but also at a subregional level, for which trade data are not available. In total, our models provide a proof of concept that the digital traces left behind by physical trade can help us capture such economic activities at a more granular level and, consequently, inform regional policies.

尽管区域间贸易对于制定有效的区域经济政策至关重要, 但很少有表述这种依赖关系的数据。我们创新地提出了一个研究框架, 利用免费网络数据和机器学习算法去预测区域间贸易流量。具体的, 我们提取了英国存档网站之间的超链接并对这些数据进行汇总, 创建了地理位置和商业网页之间的跨区域跨时间超链接网络。利用现有区域间贸易数据, 对随机森林模型进行训练。然后, 使用滚动预测框架对区域间贸易流量进行样本外预测。模型显示出强大的预测能力(R2大于0.9)。预测可以分解到不同的工业部门以及无法获得贸易数据的次区域。总体来说, 我们的模型证实, 实物贸易的数字痕迹帮助我们在更精细水平上捕捉此类经济活动, 从而为区域政策提供信息。

A pesar de la importancia que tiene el comercio interregional para edificar políticas económicas regionales efectivas, muy escasos son los datos concretos que ilustren tales interdependencias. En este escrito proponemos un marco novedoso de investigación para predecir los flujos de comercio interregional utilizando los datos web disponibles en acceso gratuito y algoritmos de aprendizaje automático. Específicamente, extraemos hipervínculos entre sitios web archivados en el Reino Unido y realizamos la agregación de estos datos para crear una red interregional de hipervínculos entre páginas web geolocalizadas y comerciales, a lo largo del tiempo. Usamos también algunos de los datos comerciales interregionales existentes para ensayar nuestros modelos utilizando bosques aleatorios, para luego formular predicciones por fuera de la muestra de los flujos interregionales del comercio, usando un marco predictivo continuo. Nuestros modelos exhiben una gran capacidad predictiva, con un R2 mayor a 0,9. Podemos, además, desagregar nuestras predicciones en términos de los sectores industriales, aunque también al nivel subregional, para el cual no hay disponibilidad de datos comerciales. En total, nuestros modelos suministran una prueba de concepto de que los rastros digitales que deja el comercio físico nos pueden ayudar a captar esas actividades comerciales a un nivel más granular y a informarnos consecuentemente sobre las políticas regionales.
Original languageEnglish
JournalAnnals of the American Association of Geographers
Early online date19 Oct 2022
DOIs
Publication statusE-pub ahead of print - 19 Oct 2022

Bibliographical note

Publisher Copyright:
© 2022 The Author(s). Published with license by Taylor & Francis Group, LLC.

Fingerprint

Dive into the research topics of 'Using the Web to Predict Regional Trade Flows: Data Extraction, Modeling, and Validation'. Together they form a unique fingerprint.

Cite this