Inteligencia de datos recién aceptada MS.

Inteligencia de datos recién aceptada MS.
https://doi.org/10.1162/dint_a_002155

Previsión del consumo total de electricidad en función de la temperatura.

índice compuesto y modelos de frecuencia mixta

LI Xuerong1,2, SHANG Wei1,2, *1, ZHANG Xun1, SHAN Baoguo3, WANG Xiang3

(1. Academia de Matemáticas y Ciencias de Sistemas, Academia China de Ciencias, Beijing 100190, Porcelana;
2. Laboratorio de Ciencias Sociales de Pronósticos Económicos Digitales y Simulación de Políticas del Ministerio de Educación en la UCAS;

3. Instituto Estatal de Investigación de Energía de Red CO., LIMITADO, Beijing 102209, Porcelana)

Resumen El consumo total de electricidad. (TEC) puede reflejar con precisión el funcionamiento de
la economía nacional, y la previsión del TEC puede ayudar a predecir la evolución económica
tendencia de desarrollo, así como proporcionar ideas para la formulación de políticas macro.
Hoy en día, Los datos masivos y de alta frecuencia de múltiples fuentes proporcionan una nueva forma de predecir
el TEC. en este documento, Se construye un “índice de temperatura estacional-acumulado” basado en
en datos de temperatura de alta frecuencia, y un modelo de predicción de frecuencia mixta basado en
big data de múltiples fuentes (Muestreo de datos mixtos con temperatura mensual y diaria
Índice de temperatura, MIDAS-MT-DT) se propone. Los resultados experimentales muestran que el
El modelo MIDAS-MT-DT logra una mayor precisión de predicción, y el “estacional-
Índice de temperatura acumulativo” puede mejorar la precisión de la predicción..

Palabras clave Consumo total de electricidad; efecto estacional; grandes datos de temperatura; alto-
frecuencia big data; modelo de predicción de frecuencia mixta

1 Introducción

yo

D
oh
w
norte
oh
a
d
mi
d

F
r
oh
metro
h

t
t

pag

:
/
/

d
i
r
mi
C
t
.

metro

i
t
.

mi
d
tu
d
norte

/

i

t
/

yo

a
r
t
i
C
mi

pag
d

F
/

d
oh

i
/

i

.

t

/

/

1
0
1
1
6
2
d
norte
_
a
_
0
0
2
1
5
2
1
2
7
0
2
5
d
norte
_
a
_
0
0
2
1
5
pag
d

.

/

t

i

Dado que la energía eléctrica está estrechamente relacionada con la producción industrial., actividades de negocio

y la vida de los residentes, Los datos de electricidad generalmente podrían reflejar la condición de operación del

economía nacional. Las estadísticas de electricidad son de gran valor para ser exploradas, que puede ayudar

el gobierno para formular políticas de macrocontrol y promover la capacidad de gobernanza

mirar hacia el desarrollo económico o social.

F

b
y
gramo
tu
mi
s
t

t

oh
norte
0
7
S
mi
pag
mi
metro
b
mi
r
2
0
2
3

1* Autor correspondiente: wei shang, Dirección de correo electrónico: shangwei@amss.ac.cn (W.. shang).

Este trabajo fue apoyado por el proyecto de ciencia y tecnología de State Grid Corporation de China. (Código de proyecto:
1400-202157207A-0-0-00); la Fundación Nacional de Ciencias Naturales de China [números de subvención 72273137].

© 2023 Academia China de Ciencias. Publicado bajo una atribución Creative Commons 4.0
Internacional (CC POR 4.0) licencia.

Inteligencia de datos recién aceptada MS.
https://doi.org/10.1162/dint_a_002155

Entre los indicadores estadísticos de la electricidad., consumo total de electricidad (TEC)

Es uno de los indicadores más completos y básicos para reflejar la electricidad.

situación de consumo de un país o región. TEC generalmente se define como el total

consumo de electricidad de la primaria, Industrias secundarias y terciarias del país.

o región, incluido

electricidad industrial, electricidad agrícola, comercial

electricidad, electricidad residencial, electricidad instalaciones publicas, etc.. El valor importante

del TEC radica en que podría reflejar las condiciones de funcionamiento de la economía nacional.

La predicción precisa de TEC puede ayudar a rastrear la tendencia del desarrollo económico y

proporcionar información para la formulación de políticas macroeconómicas.

Sin embargo, La predicción de TEC es una tarea difícil., y hay pocos estudios en

campos relacionados. TEC incluye varios sectores de consumo eléctrico con diferentes

patrones. Por lo tanto, Es difícil distinguir los factores complejos que influyen en cada uno.

otro durante el pronóstico, lo que añade incertidumbre a los resultados de la predicción.. con el

desarrollo de grandes datos, Grandes conjuntos de datos de alta frecuencia que pueden reflejar el microcomportamiento.

del consumo de electricidad proporcionan una nueva idea para la predicción de TEC. Actualmente,

Las investigaciones existentes en campos relacionados se centran principalmente en la predicción de la carga eléctrica.

[1-3], pero todavía hay pocos modelos que puedan predecir eficazmente TEC mediante fuentes múltiples.

grandes conjuntos de datos.

en este documento, un método de predicción de frecuencia mixta basado en la temperatura

índice compuesto y muestreo de datos mixtos (MIDAS) modelo, Modelo MIDAS-MT-DT,

se propone y se aplica a la predicción TEC, lo que mejora significativamente la predicción

Precisión en comparación con los modelos de referencia.. Basado en el análisis de la electricidad.

Comportamiento del consumo en diferentes estaciones., Este artículo construye la “estacionalidad”.-

índice de temperatura acumulada”, que puede reflejar con mayor precisión la electricidad

Comportamiento de consumo afectado por la temperatura.. Además, un diario de alta frecuencia

El indicador TEC también se introduce en el modelo para capturar otros factores excepto

temperatura. Para utilizar simultáneamente los dos tipos anteriores de alta frecuencia

grandes datos, Proponemos un modelo de predicción de frecuencia mixta. (MIDAS-MT-DT) para TEC

yo

D
oh
w
norte
oh
a
d
mi
d

F
r
oh
metro
h

t
t

pag

:
/
/

d
i
r
mi
C
t
.

metro

i
t
.

mi
d
tu
d
norte

/

i

t
/

yo

a
r
t
i
C
mi

pag
d

F
/

d
oh

i
/

i

.

t

/

/

1
0
1
1
6
2
d
norte
_
a
_
0
0
2
1
5
2
1
2
7
0
2
5
d
norte
_
a
_
0
0
2
1
5
pag
d

.

t

/

i

F

b
y
gramo
tu
mi
s
t

t

oh
norte
0
7
S
mi
pag
mi
metro
b
mi
r
2
0
2
3

Inteligencia de datos recién aceptada MS.
https://doi.org/10.1162/dint_a_002155

basado en el “índice de temperatura acumulada por temporada”, y seleccione TEC de Fujian

provincia, China como muestra para la investigación empírica. A través de una serie de comparaciones

experimentos con modelos de referencia, se comprueba que el modelo MIDAS-MT-DT tiene

mayor precisión de predicción, y el “índice de temperatura estacional-acumulado” tiene la

capacidad de mejorar la precisión de la predicción. La robustez y superioridad del

El marco propuesto se verifica aún más comparándolo con más modelos de referencia.

y múltiples ventanas de tiempo.

Los principales aportes de este trabajo se encuentran en los siguientes aspectos: primero, ponemos

Presentar una nueva perspectiva en la construcción de un índice compuesto de temperatura para predecir

datos de electricidad. La mayoría de los estudios anteriores han seleccionado algunos meses específicos. (verano o

invierno) y utilizó datos de temperatura para predecir intervalos de muestra locales [4-6]. El

yo

D
oh
w
norte
oh
a
d
mi
d

F
r
oh
metro
h

t
t

pag

:
/
/

d
i
r
mi
C
t
.

metro

i
t
.

mi
d
tu
d
norte

/

i

El índice de temperatura construido en este documento involucra todas las estaciones en un análisis unificado.

estructura, que es más compatible y útil para reducir el costo de aplicación del

t
/

yo

a
r
t
i
C
mi

pag
d

F
/

d
oh

i
/

i

/

/

t

.

1
0
1
1
6
2
d
norte
_
a
_
0
0
2
1
5
2
1
2
7
0
2
5
d
norte
_
a
_
0
0
2
1
5
pag
d

.

t

/

i

F

b
y
gramo
tu
mi
s
t

t

oh
norte
0
7
S
mi
pag
mi
metro
b
mi
r
2
0
2
3

sistema real. Además, Ampliamos el modelo tradicional MIDAS incorporando

variables exógenas multifrecuencia, mejorando así la capacidad de predicción de la

modelo original.

El resto del contenido de este documento está organizado de la siguiente manera: Sección 2 resume

la literatura existente sobre predicción del consumo de electricidad y la frecuencia mixta

modelo; Sección 3 presenta la construcción de una “temperatura estacional-acumulada”

índice"; Sección 4 introduce el modelo de pronóstico TEC de frecuencia mixta basado en

índice de temperatura. Sección 5 compara los resultados de pronóstico de los modelos. Sección 6

es un resumen y perspectiva.

2 Revisión de literatura

En términos de análisis y predicción del consumo eléctrico., hay muchos

Métodos de pronóstico propuestos por académicos de todo el mundo., que se puede dividir aproximadamente

en los métodos de pronóstico clásicos, métodos de pronóstico tradicionales y modernos.

Inteligencia de datos recién aceptada MS.
https://doi.org/10.1162/dint_a_002155

métodos de pronóstico inteligentes. entre ellos, el método de predicción clásico incluye

el método del coeficiente elástico, el cálculo de la capacidad de expansión del

industria, etc.. La frecuencia de los datos de los métodos de predicción tradicionales es principalmente anual y

mensual. Los modelos comúnmente utilizados incluyen modelos de series de tiempo. [1], modelos de regresión

[2] modelos de predicción grises [3-4], etc.. Con el desarrollo de la capacidad de procesamiento de datos.,

Los modelos inteligentes modernos se han utilizado ampliamente en el consumo de electricidad.

Previsión con datos mensuales y diarios.. Los investigadores han empleado varios modelos

incluido el método de predicción de redes neuronales [5], máquina de vectores de soporte [6], caos

método de predicción teórica [7], También incluye otros métodos de pronóstico combinados., etc..

En años recientes, La tecnología de big data se ha ido aplicando paulatinamente en la investigación de

predicción de datos de electricidad [8-10]. el modelo de [11] encontró que por cada 1 grado

aumento de temperatura, El consumo máximo de electricidad aumentaría en 0.45% a 4.6%.

También utilizando modelos de aprendizaje profundo., Bedi y Toshniwal (2020) proponer un aprendizaje profundo

enfoque híbrido basado en que primero implementa la descomposición en modo variacional (VMD)

y modelos de codificador automático para extraer subseñales/características significativas de los datos [12].

Ayub et al.. (2020) aplicó el modelo GRU-CNN para predecir la electricidad diaria

consumo del conjunto de datos ISO-NE, lo que mejoró la precisión de la predicción al 7%

comparado con el modelo de referencia SOTA [13]. Cui et al. (2023) proponer un profundo

Marco de aprendizaje con un ajuste COVID-19 para la previsión de la demanda eléctrica.

[14]. en el estudio de [15], el WT adaptativo (AWT)-memoria larga a corto plazo (LSTM) es

integrado en un enfoque híbrido para predecir el consumo de electricidad.

Los modelos de frecuencia mixta se han aplicado inicialmente al campo de la meteorología.,

y el principio básico es explorar la información contenida en la alta frecuencia.

datos y predecir el futuro antes de la publicación oficial de datos estadísticos relevantes. El

El modelo MIDAS es un modelo de frecuencia mixta ampliamente utilizado., propuesto por Ghysels et al..

(2004) [16]. Después, Muchos académicos han propuesto formas extendidas de MIDAS.

modelo, como el modelo MS-MIDAS [17] y el modelo de cointegración MIDAS [18].

yo

D
oh
w
norte
oh
a
d
mi
d

F
r
oh
metro
h

t
t

pag

:
/
/

d
i
r
mi
C
t
.

metro

i
t
.

mi
d
tu
d
norte

/

i

t
/

yo

a
r
t
i
C
mi

pag
d

F
/

d
oh

i
/

i

/

/

t

.

1
0
1
1
6
2
d
norte
_
a
_
0
0
2
1
5
2
1
2
7
0
2
5
d
norte
_
a
_
0
0
2
1
5
pag
d

t

.

/

i

F

b
y
gramo
tu
mi
s
t

t

oh
norte
0
7
S
mi
pag
mi
metro
b
mi
r
2
0
2
3

Inteligencia de datos recién aceptada MS.
https://doi.org/10.1162/dint_a_002155

Más recientemente, Se ha aplicado el modelo MF-VAR para estimar el valor combinado.

variables endógenas [19].

Debido a la demanda de pronósticos a tiempo en muchas industrias, frecuencia mixta

Se han aplicado modelos a la previsión de la energía eólica., flujo de pasajeros en tránsito ferroviario

pronóstico, pronóstico macroeconómico, pronóstico del mercado financiero y muchos otros

campos. Por ejemplo, Algunos académicos aplicaron el aprendizaje multitarea y el conjunto.

métodos de descomposición para pronosticar la energía eólica [20-22]. La previsión en el tiempo de

número de pasajeros en el tráfico por Yao Enjian et al.. (2018) y bao lei (2017) han mejorado mucho

la capacidad de respuesta de emergencia del sistema de tráfico en situaciones de emergencia [23, 24]. Actualmente,

Los modelos de frecuencia mixta también se utilizan ampliamente en los mercados macroeconómicos y financieros.

[25-27]. Por ejemplo, Zhang Wei et al.. (2020) [28] y Ghysel y Sinko (2011) [29]

respectivamente, pronóstico del Producto Interno Bruto (PIB) y la volatilidad de los mercados financieros.

En resumen, la literatura existente aplica varios algoritmos inteligentes y

pronostica datos de electricidad utilizando conjuntos de datos históricos. Muchos estudios han aplicado

big data meteorológicos o big data de teledetección y otros datos del entorno natural.

La mayoría de los modelos existentes utilizan datos de temperatura en meses específicos para pronosticar las temperaturas locales.

intervalos de muestra, pero no han considerado los big data de alta frecuencia de múltiples fuentes y

otra información predictiva, por lo tanto, se espera que la precisión del pronóstico sea mayor.

mejorado.

3 Datos y variables

Esta sección presenta la recopilación y el preprocesamiento de datos., así como el

construcción del “índice de temperatura estacional-acumulado”. Cifra 1 presenta el

Marco metodológico del modelo MIDAS-MT-DT para la previsión TEC.. El

El marco incluye los siguientes pasos.: 1) Recoger los datos de temperatura diaria., a diario

datos TEC, datos de temperatura mensuales y datos TEC mensuales en los datos históricos; 2)

El índice de temperatura diario se obtiene por transformación acumulativa y estacional.

transformación. El índice de temperatura mensual se obtiene por transformación estacional..

yo

D
oh
w
norte
oh
a
d
mi
d

F
r
oh
metro
h

t
t

pag

:
/
/

d
i
r
mi
C
t
.

metro

i
t
.

mi
d
tu
d
norte

/

i

t
/

yo

a
r
t
i
C
mi

pag
d

F
/

d
oh

i
/

i

/

/

t

.

1
0
1
1
6
2
d
norte
_
a
_
0
0
2
1
5
2
1
2
7
0
2
5
d
norte
_
a
_
0
0
2
1
5
pag
d

.

t

/

i

F

b
y
gramo
tu
mi
s
t

t

oh
norte
0
7
S
mi
pag
mi
metro
b
mi
r
2
0
2
3

Inteligencia de datos recién aceptada MS.
https://doi.org/10.1162/dint_a_002155

3) El índice de temperatura mensual y la variable rezagada del TEC mensual son

tomados como variables de pronóstico de baja frecuencia, y el índice de temperatura diaria y

Los TEC diarios se toman como variables de pronóstico de alta frecuencia.. la baja frecuencia

y se utilizan variables de alta frecuencia para predecir el TEC mensual. Los detalles de la

El marco anterior se presenta en la sección 3 y 4.

yo

D
oh
w
norte
oh
a
d
mi
d

F
r
oh
metro
h

t
t

pag

:
/
/

d
i
r
mi
C
t
.

metro

i
t
.

mi
d
tu
d
norte

/

i

t
/

yo

a
r
t
i
C
mi

pag
d

F
/

d
oh

i
/

i

.

/

t

/

1
0
1
1
6
2
d
norte
_
a
_
0
0
2
1
5
2
1
2
7
0
2
5
d
norte
_
a
_
0
0
2
1
5
pag
d

/

.

t

i

F

b
y
gramo
tu
mi
s
t

t

oh
norte
0
7
S
mi
pag
mi
metro
b
mi
r
2
0
2
3

Cifra 1. El marco del modelo MIDAS-MT-DT

3.1 Recopilación y preprocesamiento de datos.

En nuestro estudio empírico, el TEC mensual de la provincia de Fujian es seleccionado como el

variable predicha. El periodo de muestra es a partir de enero. 2017 a noviembre 2020, y el

La fuente de datos es la base de datos Wind.. Los big data de alta frecuencia utilizados en la predicción.

el modelo incluye 1) el diario TEC de la provincia de Fujian, proporcionado por State Grid

Instituto de Investigación de Energía Co., LIMITADO.; 2) Los datos de temperatura, que incluye Xiamen,

Putin, Fuzhou, nanping, Quanzhou, Ningdé, Longyan, Sanming y Zhangzhou de

Provincia de Fujian, y la fuente de datos es la base de datos Wind. El promedio del máximo diario.

temperatura encendida 9 ciudades de Fujian se toman como los datos de temperatura diaria originales del

índice de temperatura (𝑇𝑖,𝑚 en ecuación. (1)); el promedio de la temperatura promedio mensual en

9 ciudades de Fujian se toman como los datos de temperatura mensuales originales de la temperatura

índice (𝑇𝑚 en ecuación. (3)). En el pronóstico fuera de muestra, Primero usamos el modelo ARMA para

predecir el índice de temperatura en los períodos de prueba, y luego los valores predichos de

El índice de temperatura se ingresa en nuestros modelos de pronóstico.. El período de muestra de la

Recopilación y preprocesamiento de datos La construcción del “Índice de temperatura acumulativo estacional” Modelo de pronóstico de frecuencia mixta TEC mensual Datos de temperatura diarios Transformación estacional Transformación acumulativa Datos de temperatura mensuales TEC diario retrasado Índice de temperatura mensual Índice de temperatura diario Variables de predicción de alta frecuencia Variables de predicción de baja frecuencia Variable predicha TEC mensual retrasado TEC diario Big data de alta frecuencia

Inteligencia de datos recién aceptada MS.
https://doi.org/10.1162/dint_a_002155

Los datos de alta frecuencia anteriores son de enero. 1, 2017, a noviembre 30, 2020.

3.2 Índice de temperatura estacional-acumulado

Combinado con cambios estacionales, se puede analizar que la electricidad

El comportamiento de consumo tiene las dos características siguientes.: (1) efecto estacional: cuando

la temperatura es más alta que la temperatura confortable, producción industrial,

Los sectores comerciales y residenciales necesitan utilizar aire acondicionado para refrescarse.. En el

mismo tiempo, porque la provincia de Fujian está en la región sur de China cuando

La temperatura es más baja que la temperatura agradable en invierno., también necesita usar aire

acondicionamiento para calefacción. En resumen, La temperatura del verano debe ser positiva.

correlacionado con el consumo de electricidad, mientras que la temperatura invernal debería ser negativa

correlacionado con el consumo de electricidad. (2) Efecto acumulativo: el comportamiento de

El consumo de electricidad tiene una cierta inercia.. El comportamiento del uso del aire acondicionado en

los primeros días tienden a continuar por un corto tiempo, Entonces la temperatura del primer día.

tiene cierto impacto en los próximos días.

Basado en las dos características., los datos de temperatura diaria se transforman a través de

transformación acumulativa y transformación estacional. La fórmula del acumulativo.

la transformación es:

4
(1 − ∑ 𝑒−𝑗
𝑗=1

𝑖

4

) ∗ 𝑇𝑖,𝑚 + ∑ 𝑒−𝑗

∗ 𝑇𝑖−𝑗,𝑚, 𝑖 ≥ 5

𝑗=1

4−𝑖

) ∗ 𝑇𝑖,𝑚 + ∑ 𝑒−𝑗

∗ 𝑇𝑖−𝑗+1,𝑚 + ∑ 𝑒−(4−𝑗)

∗ 𝑇𝑁−𝑖+1,𝑚−1, 𝑖 = 1,2,3,4

𝑗=1

𝑗=𝑖

𝐶𝑇 𝑖,𝑚 =

4
(1 − ∑ 𝑒−𝑗
𝑗=1

{

(1)

donde 𝐶𝑇𝑖,𝑚 es el índice de temperatura diaria del i día del m mes transformado por
efecto acumulativo; 𝑇𝑖,𝑚 son los datos de temperatura diaria originales del i día del m

mes; N indica el número total de días en el mes m-1. j representa el número

de días antes de que yo. En nuestro estudio, asumimos el efecto acumulativo de la electricidad

el comportamiento de consumo dura 5 días, por lo tanto 𝑗 ∈ {1,2,3,4}; 𝑒−𝑗 representa la influencia

coeficiente de la temperatura del día j anterior, que disminuye según la tendencia de

logaritmo natural en el tiempo.

Después, los datos de temperatura diaria se transforman por efecto estacional

transformación, donde la fórmula es:

yo

D
oh
w
norte
oh
a
d
mi
d

F
r
oh
metro
h

t
t

pag

:
/
/

d
i
r
mi
C
t
.

metro

i
t
.

mi
d
tu
d
norte

/

i

t
/

yo

a
r
t
i
C
mi

pag
d

F
/

d
oh

i
/

i

/

/

.

t

1
0
1
1
6
2
d
norte
_
a
_
0
0
2
1
5
2
1
2
7
0
2
5
d
norte
_
a
_
0
0
2
1
5
pag
d

t

.

/

i

F

b
y
gramo
tu
mi
s
t

t

oh
norte
0
7
S
mi
pag
mi
metro
b
mi
r
2
0
2
3

Inteligencia de datos recién aceptada MS.
https://doi.org/10.1162/dint_a_002155

𝑆𝐶_𝑇𝑖,𝑚 = {

𝐶𝑇𝑖,𝑚, 𝑚 ∈ {5,6,7,8,9}, 𝑖 = 1,2, … 𝑁
𝐿 − 𝐶𝑇𝑖,𝑚, 𝑚 ∈ {10,11,12,1,2,3,4}, 𝑖 = 1,2, … 𝑁

(2)

dónde, 𝑆𝐶_𝑇𝑖,𝑚 es el índice de temperatura diaria del i día del m mes siguiente

transformación de efecto acumulativo y transformación de efecto estacional, y N es el total

número de días del mes m. L es la longitud de desplazamiento para asegurar que el

El índice de temperatura después de la transformación estacional se mantiene continuo.. en este documento, nosotros

estimar el valor de L calculando el promedio de dist( −𝐶𝑇𝑖,4, 𝐶𝑇𝑖,5 )+
dist(𝐶𝑇𝑖,9, −𝐶𝑇𝑖,10) de cada año en el período de la muestra, donde dist(𝑎, 𝑏) representa el
distancia entre a y b, eso es, dist(𝑎, 𝑏)=|ab|.

Además, los datos de temperatura mensual se transforman por efecto estacional a

obtener el índice de temperatura mensual, en el que la fórmula del efecto estacional

la transformación es:

𝑆_𝑇𝑚 = {

𝑇𝑚, 𝑚 ∈ {5,6,7,8,9}
𝐿 − 𝑇𝑚, 𝑚 ∈ {10,11,12,1,2,3,4}

(3)

donde 𝑆_𝑇𝑚 es el índice de temperatura mensual del mes m después del efecto estacional

transformación; 𝑇𝑚 son los datos de temperatura mensual originales del mes m; l es el

igual que se define en la ecuación. (4).

4 Metodología

yo

D
oh
w
norte
oh
a
d
mi
d

F
r
oh
metro
h

t
t

pag

:
/
/

d
i
r
mi
C
t
.

metro

i
t
.

mi
d
tu
d
norte

/

i

t
/

yo

a
r
t
i
C
mi

pag
d

F
/

d
oh

i
/

i

t

.

/

/

1
0
1
1
6
2
d
norte
_
a
_
0
0
2
1
5
2
1
2
7
0
2
5
d
norte
_
a
_
0
0
2
1
5
pag
d

t

.

/

i

En esta sección, El modelo de pronóstico TEC de frecuencia mixta MIDAS-MT-DT es

presentado, así como los modelos de pronóstico TEC de frecuencia única utilizados como punto de referencia

modelos. Después, presentamos nuestro diseño experimental de experimentos comparativos.

4.1 Modelo de pronóstico de frecuencia mixta basado en big data de múltiples fuentes

F

b
y
gramo
tu
mi
s
t

t

oh
norte
0
7
S
mi
pag
mi
metro
b
mi
r
2
0
2
3

Para utilizar de manera integral datos de temperatura de alta frecuencia y alta-

datos de consumo de electricidad de frecuencia, el modelo MIDAS de Ghysels et al.. (2004) es

ampliado en este documento, y un modelo de predicción de frecuencia mixta de TEC (MIDAS-MT-

DT) Se propone un “índice de temperatura acumulativo estacional”. La fórmula del

el modelo es el siguiente:

Inteligencia de datos recién aceptada MS.
https://doi.org/10.1162/dint_a_002155

𝑝𝑌−1

𝑝𝑋−1

𝑌𝑀,𝑡+1 = 𝜇 + ∑ 𝜇𝑗+1𝑌𝑡−𝑗

+ ∑ 𝛽𝑗+1𝑆_𝑇𝑡−𝑗

𝑝𝑋−1

𝑁−1

𝑗=0

𝑗=0

𝑝𝑋−1

𝑁−1

+𝛽 ∑ ∑ 𝑤𝑁−𝑖+𝑗∗𝑁(𝜽)𝑌𝐷, 𝑁−𝑖,𝑡−𝑗

+ 𝛿 ∑ ∑ 𝑤𝑁−𝑖+𝑗∗𝑁(𝜽)𝑆𝐶_𝑇𝑁−𝑖,𝑡−𝑗

+ 𝑢𝑡+1

𝑗=0

𝑖=0

𝑗=0

𝑖=0

(4)

dónde, 𝑌𝑀,𝑡+1 es el TEC mensual del mes t, 𝑆_𝑇𝑡 es la temperatura mensual

índice del mes t después de la transformación estacional, 𝑌𝐷, 𝑁,𝑡 es el TEC diario del día N

del mes t, 𝑆𝐶_𝑇𝑁,𝑡 es el índice de temperatura diaria del día N del mes t posterior

transformación acumulativa y transformación estacional. 𝑤𝑖(𝜽) es una alta frecuencia

polinomios de ponderación de retardo variable del modelo MIDAS, 𝜽 es el parámetro estimado

polinomio, y ∑

𝑝𝑋−1
𝑗=0

𝑁−1
𝑖=0

𝑤𝑁−𝑖+𝑗∗𝑁(𝜽)

= 1 ; 𝜇 , 𝜇𝑗+1 , 𝛽 , 𝛽𝑗+1 , 𝛿 son los

Parámetros a ser estimados por el modelo., 𝑝𝑋 y 𝑝𝑌 son el período de retraso óptimo de la

modelo seleccionado por criterio AIC, i y j son los números enteros en el operador sumativo, y

𝑢𝑡+1 es el error aleatorio del modelo. Los parámetros se estiman mediante no lineal.

Mínimos cuadrados (SNL).

En el experimento de comparación, Empleamos la función de peso de retardo Almon y Beta de

modelo MIDAS, que se definen como

y

𝑤𝑖

𝐴𝑙𝑚𝑜𝑛(𝜃1, 𝜃2) =

𝑒𝜃1𝑖+𝜃2𝑖 2
∑ 𝑒𝜃1𝑖+𝜃2𝑖 2
𝑁
𝑖=1

𝑤𝑖

𝐵𝑒𝑡𝑎 (𝜃1, 𝜃2, 𝜃3) =

𝜃1−1(1 − 𝑥𝑖)𝜃2−1
𝑥𝑖
𝑁
∑ 𝑥𝑖
𝑖=1

𝜃1−1(1 − 𝑥𝑖)𝜃2−1

+ 𝜃3

(5)

(6)

.
donde 𝑥𝑖 = (𝑖 − 1) (𝑁 − 1)

4.2 Modelos de pronóstico de frecuencia única

Para verificar el poder predictivo del modelo MIDAS-MT-DT y el

“Índice de temperatura estacional-acumulado”, varios experimentos comparativos de un solo-

Se realizan modelos de pronóstico de frecuencia.. Primero, Autoregresivo diario y mensual

Media móvil (ARMA) Los modelos se utilizan para comparar la precisión de la predicción con

y sin el índice de temperatura. Específicamente, el modelo ARMA mensual es:

𝑝𝑌−1

𝑝𝑋−1

𝑝𝑍−1

𝑌𝑀,𝑡+1 = 𝜇 + ∑ 𝜇𝑗+1𝑌𝑀,𝑡−𝑗

+ ∑ 𝛽𝑗+1𝑆_𝑇𝑡−𝑗

+ ∑ 𝛿𝑗+1𝑢𝑡+1

(7)

𝑗=0

𝑗=0

𝑗=0

yo

D
oh
w
norte
oh
a
d
mi
d

F
r
oh
metro
h

t
t

pag

:
/
/

d
i
r
mi
C
t
.

metro

i
t
.

mi
d
tu
d
norte

/

i

t
/

yo

a
r
t
i
C
mi

pag
d

F
/

d
oh

i
/

i

/

/

.

t

1
0
1
1
6
2
d
norte
_
a
_
0
0
2
1
5
2
1
2
7
0
2
5
d
norte
_
a
_
0
0
2
1
5
pag
d

/

t

.

i

F

b
y
gramo
tu
mi
s
t

t

oh
norte
0
7
S
mi
pag
mi
metro
b
mi
r
2
0
2
3

Inteligencia de datos recién aceptada MS.
https://doi.org/10.1162/dint_a_002155

donde 𝑌𝑀,𝑡 es el TEC mensual en el mes t, 𝑆_𝑇𝑡 es el índice de temperatura mensual de

el mes t después de la transformación estacional, y 𝑢𝑡+1 es independiente e idénticamente

variable aleatoria distribuida, representando el error del modelo.

El modelo ARMA diario es:

𝑝𝑌−1

𝑝𝑋−1

𝑝𝑍−1

𝑌𝐷,𝑡+1 = 𝜇 + ∑ 𝜇𝑗+1𝑌𝐷,𝑡−𝑗

+ ∑ 𝛽𝑗+1𝑆𝐶_𝑇𝑡−𝑗

+ ∑ 𝛿𝑗+1𝑢𝑡+1

(8)

𝑗=0

𝑗=0

𝑗=0

dónde, 𝑌𝐷,𝑡 es el TEC diario del día t, y 𝑆𝐶_𝑇𝑡 es la alta frecuencia diaria

índice de temperatura en el día t después de la transformación estacional y acumulativa.

4.3 Diseño experimental

La precisión de predicción de los modelos MIDAS con temperatura diaria o mensual.

Se comparan respectivamente el índice y el índice de temperatura sin él.. Además, mezclado-

Los modelos de frecuencia se comparan con varios modelos de frecuencia única.. Además de

modelos ARMA, algunos modelos inteligentes como la regresión de vectores de soporte (RVS) y

Bosque aleatorio (RF) Los modelos se seleccionan como modelos de referencia.. para resumir, el

Las especificaciones del modelo y los parámetros de los experimentos de comparación se muestran en la tabla.

1.

Mesa 1. Especificaciones y parámetros del modelo.

Etiqueta de modelo

Especificaciones del modelo

Parámetros del modelo

ARMA-M

Modelo ARMA mensual de frecuencia única, con

En ecuación. (7), 𝛽𝑗 = 0

variables rezagadas y sin índice de temperatura

ARMA-D

Modelo ARMA diario de frecuencia única, con

En ecuación. (8), 𝛽𝑗 = 0

variables rezagadas y sin índice de temperatura

ARMA-MT

Modelo ARMA mensual con mensual

En ecuación. (7), 𝛽𝑗 ≠ 0

índice de temperatura y variables rezagadas

ARMA-DT

Modelo ARMA diario con temperatura diaria.

En ecuación. (8), 𝛽𝑗 ≠ 0

índice y variables rezagadas

SVR-M

Modelo SVR mensual de frecuencia única, con

variables rezagadas y sin índice de temperatura

SVR-D

Modelo SVR diario de frecuencia única, con

variables rezagadas y sin índice de temperatura

Valores predeterminados de Python Scikit-

SVR-MT

Modelo SVR mensual con temperatura mensual

aprender biblioteca

índice y variables rezagadas

RVS-DT

Modelo SVR diario con índice de temperatura diario

y variables rezagadas

yo

D
oh
w
norte
oh
a
d
mi
d

F
r
oh
metro
h

t
t

pag

:
/
/

d
i
r
mi
C
t
.

metro

i
t
.

mi
d
tu
d
norte

/

i

t
/

yo

a
r
t
i
C
mi

pag
d

F
/

d
oh

i
/

i

t

/

.

/

1
0
1
1
6
2
d
norte
_
a
_
0
0
2
1
5
2
1
2
7
0
2
5
d
norte
_
a
_
0
0
2
1
5
pag
d

.

t

/

i

F

b
y
gramo
tu
mi
s
t

t

oh
norte
0
7
S
mi
pag
mi
metro
b
mi
r
2
0
2
3

Inteligencia de datos recién aceptada MS.
https://doi.org/10.1162/dint_a_002155

RF-M

Modelo RF mensual de frecuencia única, con

variables rezagadas y sin índice de temperatura

RF-D

Modelo RF diario de frecuencia única, con rezagado

variables y sin índice de temperatura

RF-MT

Modelo RF mensual con temperatura mensual.

índice y variables rezagadas

RF-DT

Modelo RF diario con índice de temperatura diario.

y variables rezagadas

MIDAS

Modelo de referencia de frecuencia mixta, sin

En ecuación. (4), 𝛽𝑗 = 0,𝛿 = 0

índice de temperatura

MIDAS-MT

Modelo MIDAS con índice de temperatura mensual.

En ecuación. (4), 𝛽𝑗 ≠ 0,𝛿 = 0

y sus variables rezagadas

MIDAS-DT

Modelo MIDAS con índice de temperatura diaria.

MIDAS-MT-DT

Modelo MIDAS con índice de temperatura mensual.

En ecuación. (4), 𝛽𝑗 = 0,𝛿 ≠ 0
En ecuación. (4), 𝛽𝑗 ≠ 0,𝛿 ≠ 0

y sus variables rezagadas, así como el diario

índice de temperatura

yo

D
oh
w
norte
oh
a
d
mi
d

F
r
oh
metro
h

t
t

pag

:
/
/

d
i
r
mi
C
t
.

metro

i
t
.

5 Resultados empíricos

t
/

yo

a
r
t
i
C
mi

pag
d

F
/

d
oh

i
/

mi
d
tu
d
norte

/

i

En esta sección, el desempeño de pronóstico del modelo MIDAS-MT-DT y el

El “índice de temperatura acumulativo estacional” se ilustra a través de una serie de estudios comparativos.

resultados experimentales. Primero, la descripción de la “temperatura acumulada estacional

índice” se presentan, y luego los resultados de predicción de los modelos de frecuencia única y

los modelos de frecuencia de mezcla se comparan respectivamente.

5.1 Descripción de datos y análisis de correlación.

Según el método de construcción en la Sección 3.2, la descripción del

El “índice de temperatura acumulada por temporada” se muestra en la Figura 2. Según los resultados

en la figura, el índice de temperatura construido en este trabajo mantiene una tendencia general

de correlación positiva con Fujian TEC, lo que indica que puede mejorar la

pronóstico del rendimiento de los datos de temperatura.

i

/

/

.

t

1
0
1
1
6
2
d
norte
_
a
_
0
0
2
1
5
2
1
2
7
0
2
5
d
norte
_
a
_
0
0
2
1
5
pag
d

t

.

/

i

F

b
y
gramo
tu
mi
s
t

t

oh
norte
0
7
S
mi
pag
mi
metro
b
mi
r
2
0
2
3

Inteligencia de datos recién aceptada MS.
https://doi.org/10.1162/dint_a_002155

60

50

40

30

20

10

0

10

9

8

7

6

5

4

3

2

1

0

Datos de temperatura sin procesar

Índice de temperatura estacional-acumulado

TEC de Fujian

Cifra 2. La descripción del “índice de temperatura acumulada por temporada”

Mesa 2 muestra las estadísticas descriptivas y los resultados del análisis de correlación del crudo

datos de temperatura, “Índice de temperatura acumulativo estacional” y TEC diario de Fujian. El

Los resultados muestran que el coeficiente de correlación entre el “estacional-acumulado”

índice de temperatura” y Fujian TEC es 0.6540, mientras que el coeficiente de correlación entre

Los datos de temperatura sin procesar y Fujian TEC son solo -0.3060. Esto indica que el

El método de construcción del índice de temperatura en este documento puede mejorar efectivamente la

correlación con las variables predichas.

Mesa 2. Estadística descriptiva y análisis de correlación.

Datos de temperatura sin procesar

Acumulativo estacional

TEC de Fujian

índice de temperatura

Significar

Máximo

Mínimo

estándar. desarrollador.

Oblicuidad

Curtosis

Correlación de Pearson

coeficiente con Fujian TEC

26.1478

9.4058

37.2591

6.5261

-1.0306

-0.2506

-0.3060

35.5638

50.5942

22.3403

5.1441

0.2943

2.6980

0.6540

6.2101

3.4423

8.9278

0.9815

0.2392

-0.0345

1

yo

D
oh
w
norte
oh
a
d
mi
d

F
r
oh
metro
h

t
t

pag

:
/
/

d
i
r
mi
C
t
.

metro

i
t
.

mi
d
tu
d
norte

/

i

t
/

yo

a
r
t
i
C
mi

pag
d

F
/

d
oh

i
/

i

.

t

/

/

1
0
1
1
6
2
d
norte
_
a
_
0
0
2
1
5
2
1
2
7
0
2
5
d
norte
_
a
_
0
0
2
1
5
pag
d

t

.

/

i

F

b
y
gramo
tu
mi
s
t

t

oh
norte
0
7
S
mi
pag
mi
metro
b
mi
r
2
0
2
3

Inteligencia de datos recién aceptada MS.
https://doi.org/10.1162/dint_a_002155

5.2 Modelos de pronóstico de frecuencia única

Verificar la capacidad predictiva del “índice de temperatura estacional-acumulado”,

Se utilizan modelos diarios y mensuales para comparar la precisión de la predicción con y sin

el índice de temperatura, respectivamente. Los resultados de la predicción se muestran en la tabla. 3. En el

mesa, columna 1 representa el período de prueba, y el periodo de formación correspondiente es

desde el inicio de la muestra hasta el mes anterior del período de prueba. El

Las precisiones de predicción se calculan mediante las siguientes fórmulas.:

𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 (𝐴𝐶𝐶) = 1 −

1
𝑁

𝑁

∑ |
𝑡=1

𝑥̂𝑡 − 𝑥𝑡
𝑥𝑡

|

𝑅𝑜𝑜𝑡 𝑀𝑒𝑎𝑛 𝑆𝑞𝑢𝑎𝑟𝑒𝑑 𝐸𝑟𝑟𝑜𝑟 (𝑅𝑀𝑆𝐸) = √

1
𝑁

𝑁

∑(
𝑡=1

𝑥̂𝑡 − 𝑥𝑡
𝑥𝑡

)2

(7)

(8)

donde 𝑥̂𝑡 y 𝑥𝑡 representan el valor predicho y el valor real del pronóstico

modelo, respectivamente.

Mesa 3. Resultados de predicción de modelos de frecuencia única.

Grupo A: Modelos de frecuencia mensual

Período de prueba

ARMA-M

ARMA-MT

SVR-M

SVR-MT

RF-M

RF-MT

2020.1-

2020.3

2020.4-

2020.6

2020.7-

2020.9

CAC

63.42%

83.20%

76.84%

92.67%

77.60%

92.85%

RMSE

17.7056

16.0453

23.9215

7.2015

24.1843

7.9507

CAC

62.89%

70.12%

87.11%

93.11%

86.54%

91.71%

RMSE

54.6691

53.8693

27.9021

14.8238

20.8601

15.2980

CAC

62.43%

82.31%

87.48%

89.13%

81.16%

86.97%

RMSE

58.1760

33.7527

23.9188

21.8095

31.4153

25.0699

2020.10-

CAC

69.75%

75.52%

74.02%

89.64%

73.95%

85.67%

2020.11

RMSE

48.1106

33.5277

39.9282

16.1358

34.1574

21.0209

Grupo B: Modelos de frecuencia diaria

Período de prueba

ARMA-D

ARMA-DT

SVR-D

RVS-DT

RF-D

RF-DT

2020.8.1-

CAC

61.10%

97.72%

82.92%

95.49%

85.16%

94.98%

2020.8.31

RMSE

3.1863

0.2353

1.6579

0.4335

1.4492

0.4886

2020.9.1-

CAC

67.51%

89.07%

84.03%

95.76%

87.21%

88.73%

2020.9.30

RMSE

2.5071

0.9195

1.4930

0.3945

1.2188

0.9456

2020.10.1-

CAC

76.72%

96.39%

74.48%

95.24%

82.61%

93.19%

2020.10.31

RMSE

1.5694

0.3934

1.9787

0.3897

1.3973

0.5174

2020.11.1-

CAC

74.17%

98.23%

84.62%

95.22%

79.36%

94.30%

yo

D
oh
w
norte
oh
a
d
mi
d

F
r
oh
metro
h

t
t

pag

:
/
/

d
i
r
mi
C
t
.

metro

i
t
.

mi
d
tu
d
norte

/

i

t
/

yo

a
r
t
i
C
mi

pag
d

F
/

d
oh

i
/

i

/

t

/

.

1
0
1
1
6
2
d
norte
_
a
_
0
0
2
1
5
2
1
2
7
0
2
5
d
norte
_
a
_
0
0
2
1
5
pag
d

t

/

.

i

F

b
y
gramo
tu
mi
s
t

t

oh
norte
0
7
S
mi
pag
mi
metro
b
mi
r
2
0
2
3

Inteligencia de datos recién aceptada MS.
https://doi.org/10.1162/dint_a_002155

2020.11.30

RMSE

1.7447

0.1587

1.3304

0.3790

1.6610

0.4516

Nota: Los números en negrita en la tabla indican modelos con precisión predictiva mejorada en comparación

al modelo de referencia.

Según los resultados de la tabla., en todos los periodos de prueba, independientemente del día a día

o la base mensual, las precisiones de predicción de los modelos de pronóstico agregados con el

El índice de temperatura mejora significativamente en comparación con los modelos de referencia..

Los modelos inteligentes como SVR y RF funcionan mucho mejor que los modelos ARMA en el

casos de los modelos mensuales. A diario, modelos inteligentes y modelos ARMA

son competitivos. entre ellos, la precisión de predicción más alta ha alcanzado 98.23%. El

resultados en la tabla 3 mostrar que el índice de temperatura construido en este artículo puede

mejorar significativamente la capacidad de pronóstico de los modelos de referencia al

reflejando la influencia del comportamiento del consumo de electricidad en TEC.

5.3 Modelos de pronóstico de frecuencia mixta

Para verificar la capacidad de predicción del modelo MIDAS-MT-DT, el

Precisión de predicción del modelo MIDAS con datos diarios., e índice de temperatura mensual

y sin índice de temperatura se comparan respectivamente. Los resultados de la predicción son

mostrado en la tabla 4. La primera columna de la tabla representa el período de prueba del modelo.,

y el período de capacitación correspondiente es desde el inicio del período de muestra hasta el

mes anterior del período de prueba. Las precisiones de predicción de los correspondientes

los modelos se calculan mediante la ecuación. (7-8).

Mesa 4. Resultados de predicción de modelos de frecuencia mixta.

Grupo A: Consumo total de electricidad de Fujian

yo

D
oh
w
norte
oh
a
d
mi
d

F
r
oh
metro
h

t
t

pag

:
/
/

d
i
r
mi
C
t
.

metro

i
t
.

mi
d
tu
d
norte

/

i

t
/

yo

a
r
t
i
C
mi

pag
d

F
/

d
oh

i
/

i

/

/

.

t

1
0
1
1
6
2
d
norte
_
a
_
0
0
2
1
5
2
1
2
7
0
2
5
d
norte
_
a
_
0
0
2
1
5
pag
d

.

/

t

i

F

b
y
gramo
tu
mi
s
t

t

oh
norte
0
7
S
mi
pag
mi
metro
b
mi
r
2
0
2
3

Almón-MIDAS

Beta-MIDAS

Período de prueba

MIDAS

MIDAS-MT MIDAS-DT MIDAS-MT-DT

MIDAS MIDAS-MT MIDAS-DT MIDAS-MT-DT

2020.1-
2020.3

2020.4-
2020.6

2020.7-
2020.9

2020.10-
2020.11

CAC

RMSE

CAC

RMSE

CAC

RMSE

CAC

RMSE

83.21%

86.15%

16.6583

21.0858

96.54%

93.35%

4.8878

7.2637

94.45%

94.91%

9.0774

7.5643

94.23%

95.62%

90.86%

10.4433

94.00%

9.0697

94.30%

7.9832

89.58%

5.3534

4.2126

12.2389

86.15%

12.4566

98.39%

2.3340

96.29%

6.1133

95.18%

3.5138

80.68%

94.30%

81.87%

18.8926

5.0649

18.6801

84.34%

91.62%

90.94%

23.8644

14.2741

14.4594

93.64%

91.13%

87.83%

11.5742

17.2138

20.4678

90.66%

93.09%

93.38%

13.0001

12.4452

8.8826

96.93%

3.4150

94.72%

7.3290

96.73%

5.1104

98.02%

3.7987

Inteligencia de datos recién aceptada MS.
https://doi.org/10.1162/dint_a_002155

Grupo B: Consumo de electricidad residencial de Fujian

Almón-MIDAS

Beta-MIDAS

Período de prueba

MIDAS

MIDAS-MT MIDAS-DT MIDAS-MT-DT

MIDAS MIDAS-MT MIDAS-DT MIDAS-MT-DT

2020.1-
2020.3

2020.4-
2020.6

2020.7-
2020.9

2020.10-
2020.11

CAC

RMSE

CAC

RMSE

CAC

RMSE

CAC

RMSE

91.51%

94.84%

3.4390

2.1221

90.57%

3.8354

88.79%

87.20%

90.74%

5.4743

5.6525

88.39%

94.68%

7.8735

4.4300

4.7849

86.43%

9.9840

87.59%

92.30%

95.49%

5.0707

3.5147

1.7105

92.69%

4.1736

94.96%

2.2653

94.59%

3.1155

93.74%

2.5531

80.89%

85.07%

84.96%

16.4449

14.7521

15.5679

88.86%

92.04%

83.15%

20.1651

11.3245

26.7171

82.40%

91.79%

92.87%

26.8130

11.6818

10.3671

86.68%

85.01%

90.50%

21.6887

26.0945

13.6509

Grupo C: El consumo de electricidad de la industria terciaria de Fujian
Almón-MIDAS

Beta-MIDAS

92.33%

9.0528

95.59%

7.5793

94.95%

11.6454

92.23%

13.8566

yo

D
oh
w
norte
oh
a
d
mi
d

Período de prueba

MIDAS

MIDAS-MT MIDAS-DT MIDAS-MT-DT

MIDAS MIDAS-MT MIDAS-DT MIDAS-MT-DT

2020.1-
2020.3

2020.4-
2020.6

2020.7-
2020.9

2020.10-
2020.11

CAC

RMSE

CAC

RMSE

CAC

RMSE

CAC

RMSE

82.26%

91.45%

4.8074

2.7748

91.48%

93.18%

3.0102

1.8038

81.06%

4.4253

85.19%

4.0636

90.77%

89.33%

93.59%

5.3767

5.5239

95.12%

90.61%

2.0203

3.9438

3.2686

90.73%

3.2524

94.32%

1.6667

94.57%

1.4146

97.24%

1.3215

97.25%

0.9801

84.00%

83.56%

78.24%

4.1694

4.7109

4.7102

84.77%

81.86%

89.79%

5.1318

5.9643

3.3482

77.35%

90.60%

82.25%

11.3417

4.8776

7.9887

83.82%

90.98%

79.14%

5.93041

3.0239

7.1812

93.40%

2.5181

91.51%

3.0738

86.34%

6.7196

91.15%

3.2041

Nota: Los números en negrita en la tabla indican modelos con precisión predictiva mejorada en comparación con el modelo MIDAS de referencia..

Según los resultados de la tabla., en todos los periodos de prueba, independientemente de si

se suma el índice de temperatura diario o índice de temperatura mensual, la predicción

Las precisiones de los modelos mejoran significativamente en comparación con el punto de referencia.

modelos. entre ellos, la precisión de predicción más alta ha alcanzado 98.39%. Además,

el modelo MIDAS-MT y el modelo MIDAS-MT-DT han obtenido mayor predicción

precisiones que los modelos de referencia en la mayoría de los cuatro períodos de prueba. Sin embargo,

sólo uno de los modelos MIDAS-DT logra una mayor precisión de predicción. Esto indica

que el índice de temperatura mensual tiene una mejor capacidad predictiva que el diario

índice de temperatura. Comparando diferentes polinomios de ponderación de retraso de MIDAS

modelos, También encontramos que los modelos Almon-MIDAS funcionan mejor que Beta-MIDAS en

la mayoría de las muestras de datos.

Para verificar la solidez de nuestro modelo en más conjuntos de datos, aplicamos aún más nuestro

Modelos para pronosticar el consumo eléctrico residencial. (REC) de Fujian y el

Consumo de electricidad de la industria terciaria de Fujian. Los resultados en el Panel B y C de

F
r
oh
metro
h

t
t

pag

:
/
/

d
i
r
mi
C
t
.

metro

i
t
.

mi
d
tu
d
norte

/

i

t
/

yo

a
r
t
i
C
mi

pag
d

F
/

d
oh

i
/

i

t

/

.

/

1
0
1
1
6
2
d
norte
_
a
_
0
0
2
1
5
2
1
2
7
0
2
5
d
norte
_
a
_
0
0
2
1
5
pag
d

/

.

t

i

F

b
y
gramo
tu
mi
s
t

t

oh
norte
0
7
S
mi
pag
mi
metro
b
mi
r
2
0
2
3

Inteligencia de datos recién aceptada MS.
https://doi.org/10.1162/dint_a_002155

Mesa 4 muestran que el modelo MIDAS-MT-DT logra mejores rendimientos en todas las pruebas

períodos de múltiples conjuntos de datos. También hemos observado resultados similares a los del Panel A.

eso, el índice de temperatura mensual tiene una mayor capacidad para mejorar la predicción

Precisión en el modelo de frecuencia de mezcla.. En general, nuestros resultados demuestran que el

El modelo MIDAS-MT-DT propuesto en este artículo mejora significativamente la predicción

precisión del TEC mediante la incorporación de datos de temperatura de alta frecuencia y alta-

datos de frecuencia TEC, y esta ventaja no se ve afectada fácilmente por la aleatoriedad de la

conjunto de datos con buena robustez.

6 Conclusiones e investigaciones futuras.

El consumo total de electricidad (TEC) refleja el funcionamiento del sistema nacional

economía. La predicción precisa del TEC es de gran importancia para el país.

impulsar el desarrollo económico y formular políticas de macrocontrol. el alto-

La frecuencia y los datos masivos de múltiples fuentes proporcionan una nueva idea para la predicción de TEC..

Basado en el análisis del comportamiento del consumo eléctrico en diferentes estaciones., este

estudio construye un “índice de temperatura estacional-acumulado” considerando la inercia de

Estaciones y comportamiento del consumo eléctrico., que puede reflejar la electricidad

Comportamiento de consumo afectado por la temperatura.. Además, datos diarios de alta frecuencia

También se incorpora el TEC para complementar el comportamiento del consumo eléctrico.

afectado por otros factores. Basado en los dos conjuntos de datos de alta frecuencia anteriores, este estudio

propone un modelo de predicción de frecuencia mixta (MIDAS-MT-DT) para el TEC basado en

el “índice de temperatura acumulativo estacional” y los modelos de frecuencia mixta.

Según los resultados empíricos, El índice de temperatura construido en este artículo.

es capaz de mejorar significativamente la capacidad de pronóstico del modelo de referencia al

reflejando el comportamiento del consumo de electricidad afectado por la temperatura y otros

factores. Incorporando datos de temperatura de alta frecuencia y datos TEC diarios, el

El modelo MIDAS-MT-DT propuesto en este artículo captura los intrincados factores de

comportamiento del consumo de electricidad, por lo tanto mejora significativamente la precisión de la predicción

del TEC, y la mayor precisión ha alcanzado 98.39%. A través de comparativa

experimentos, encontramos que el índice de temperatura mensual tiene una mayor capacidad para

mejorar la precisión de la predicción en el modelo de frecuencia de mezcla. Los experimentos de

yo

D
oh
w
norte
oh
a
d
mi
d

F
r
oh
metro
h

t
t

pag

:
/
/

d
i
r
mi
C
t
.

metro

i
t
.

mi
d
tu
d
norte

/

i

t
/

yo

a
r
t
i
C
mi

pag
d

F
/

d
oh

i
/

i

.

/

t

/

1
0
1
1
6
2
d
norte
_
a
_
0
0
2
1
5
2
1
2
7
0
2
5
d
norte
_
a
_
0
0
2
1
5
pag
d

.

/

t

i

F

b
y
gramo
tu
mi
s
t

t

oh
norte
0
7
S
mi
pag
mi
metro
b
mi
r
2
0
2
3

Inteligencia de datos recién aceptada MS.
https://doi.org/10.1162/dint_a_002155

múltiples períodos de prueba y conjuntos de datos pronosticados verifican aún más la solidez del

Modelo MIDAS-MT-DT.

En términos de las limitaciones de este artículo., Las direcciones de investigación futuras incluyen: En

Además del big data de temperatura., otros datos microscópicos que pueden reflejar la

Se puede recopilar aún más el comportamiento del consumo de electricidad., y más exógeno

Se pueden introducir variables en el modelo de predicción.. Los ejemplos incluyen la teledetección

datos y datos de internet. En términos del modelo de predicción., la tecnología de fusión de múltiples-

fuente de electricidad big data, Se pueden explorar modelos de aprendizaje automático y aprendizaje profundo.

para mejorar aún más la precisión de la predicción.

Contribuciones de autor

Xuerong Li ha recopilado y procesado datos experimentales., presentó los resultados del experimento y

Redactó la versión original del manuscrito.; Wei Shang ha guiado la dirección general de

esta investigación, y brindó asesoramiento para experimentos de comparación.. Xun Zhang brindó consejos para

motivación y conclusiones presentadas en la Sección 1. Baoguo Shan y Xiang Wang han financiado

la investigación, presentó la propuesta de investigación, y contribuyó con parte del experimento

datos. Todos los autores han hecho contribuciones significativas y valiosas en la revisión y

corregir el manuscrito resultante.

Referencias

[1] A. hussain, METRO. Rahmán & j. A. Memon. Previsión del consumo de electricidad en Pakistán: El

camino a seguir. Política energética 90 (2016), 73-80. doi: 10.1016/j.enpol.2015.11.028.

[2] Y. feng & S. METRO. ryan. Modelado de carga eléctrica horaria diaria mediante regresión funcional.

Energía Aplicada, 170 (2016), 455-465. doi: 10.1016/j.apenergy.2016.02.118.

yo

D
oh
w
norte
oh
a
d
mi
d

F
r
oh
metro
h

t
t

pag

:
/
/

d
i
r
mi
C
t
.

metro

i
t
.

mi
d
tu
d
norte

/

i

t
/

yo

a
r
t
i
C
mi

pag
d

F
/

d
oh

i
/

i

/

t

.

/

1
0
1
1
6
2
d
norte
_
a
_
0
0
2
1
5
2
1
2
7
0
2
5
d
norte
_
a
_
0
0
2
1
5
pag
d

t

/

.

i

F

b
y
gramo
tu
mi
s
t

t

oh
norte
0
7
S
mi
pag
mi
metro
b
mi
r
2
0
2
3

Inteligencia de datos recién aceptada MS.
https://doi.org/10.1162/dint_a_002155

[3] W.. Xu, R. Gu, Y. Liu & Y. dai. Previsión del consumo de energía utilizando un nuevo GM-ARMA

modelo basado en filtro HP: El caso de la provincia china de Guangdong. Modelado económico,

45 (2015), 127-135. doi: 10.1016/j.econmod.2014.11.011.

[4] l. Zeng, C. Liu & W.. z. Wu. Un novedoso GM discreto (2, 1) modelo con un término polinómico para

previsión del consumo de electricidad. Investigación de sistemas de energía eléctrica, 214 (2023), 108926.

doi: 10.1016/j.epsr.2022.108926.

[5] norte. Kunwar, k. yash & R. Kumar. Precios basados ​​en carga de área en DSM a través de ANN y heurística

programación. Red inteligente, 4 (2013), 1275-1281. doi: 10.1109/TSG.2013.2262059.

[6] q. cheng, Y. yan, S. Liu, C. Cual, h. chaoui & METRO. alzaed. Electricidad basada en filtros de partículas

predicción de carga para la programación diaria de microrredes conectadas a la red. Energías, 13 (2020),

6489. doi: 10.3390/es13246489.

[7] z. j. Liu, h. METRO. Cual & METRO. Y. Dejar. Modelo de previsión del precio de la electricidad basado en la teoría del caos..

En: Actas de 2005 Conferencia Internacional de Ingeniería Energética, 2005, páginas. 1-9. doi:

10.1109/IPEC.2005.206950.

[8] X. guo, q. zhao, D. Zheng, Y. Y & Y. gao. Un modelo de pronóstico de carga a corto plazo de múltiples-

escalar la red neuronal híbrida CNN-LSTM considerando el precio de la electricidad en tiempo real. Energía

Informes, 6 (2020), 1046-1053. doi: 10.1016/j.egyr.2020.11.078.

[9] PAG. Jiang, Y. NO, j. Wang & X. Huang. Previsión multivariable del precio de la electricidad a corto plazo

utilizando inteligencia artificial y esquema de múltiples entradas y múltiples salidas. Economía energética, 117

(2023), 106471. doi: 10.1016/j.eneco.2022.106471.

[10] Y. Jiang, t. gao, Y. dai, R. Y, j. hao, j. zhang & D. W.. gao. Residencial de muy corta duración

previsión de carga basada en deep-autoformer. Energía Aplicada, 2022, 328: 120120. doi:

10.1016/j.apenergy.2022.120120.

[11] METRO. Santamouris, C. Cartalis, A. Sinnefa, D. dibujar. Sobre el impacto de la isla de calor urbana

y el calentamiento global en la demanda de energía y el consumo de electricidad de los edificios—A

revisar. Energía & Edificios, 98 (2015), 119-124. doi: 10.1016/j.enbuild.2014.09.052.

[12] j. bedi & D. Tashniwal. Pronóstico de series temporales de carga de energía mediante descomposición y

red de memoria integrada del codificador automático. Computación blanda aplicada, 93 (2020), 106390. doi:

10.1016/j.asoc.2020.106390.

[13] norte. Ayub, METRO. Irfan, METRO. अवाई, Ud.. Alí, t. Alí, METRO. Hamdi, A. Alghamdi & F. Mahoma. Grande

Análisis de datos para la previsión de carga eléctrica a corto y medio plazo utilizando técnicas de IA.

conjuntos. Energías, 13 (2020), 5193. doi: 10.3390/es13195193.

yo

D
oh
w
norte
oh
a
d
mi
d

F
r
oh
metro
h

t
t

pag

:
/
/

d
i
r
mi
C
t
.

metro

i
t
.

mi
d
tu
d
norte

/

i

t
/

yo

a
r
t
i
C
mi

pag
d

F
/

d
oh

i
/

i

/

.

/

t

1
0
1
1
6
2
d
norte
_
a
_
0
0
2
1
5
2
1
2
7
0
2
5
d
norte
_
a
_
0
0
2
1
5
pag
d

.

t

/

i

F

b
y
gramo
tu
mi
s
t

t

oh
norte
0
7
S
mi
pag
mi
metro
b
mi
r
2
0
2
3

Inteligencia de datos recién aceptada MS.
https://doi.org/10.1162/dint_a_002155

[14] z. Cual, j. Wu, W.. lian & Y. GRAMO. Wang. Un novedoso marco de aprendizaje profundo con un COVID-19

ajuste para la previsión de la demanda de electricidad. Informes energéticos, 9 (2023), 1887-1895. doi:

10.1016/j.egyr.2023.01.019.

[15] A. saranj & METRO. Zolfaghari. La previsión del consumo eléctrico.: Adoptando un híbrido

Enfoque mediante aprendizaje profundo y modelos ARIMAX-GARCH.. Informes energéticos, 8 (2022), 7657-

7679. doi: 10.1016/j.egyr.2022.06.007.

[16] mi. Ghysels, PAG. Santa-Clara P & R. Valkánov. El toque MIDAS: Muestreo de datos mixtos

modelos de regresión. UC

Los Angeles:

Finanzas.

(2004). Disponible

en:

http://escholarship.org/uc/item/9mf223rs.

[17] PAG. Guérin & METRO. Marcelino. Modelo MIDAS de conmutación de Markov. Revista de negocios &

Estadísticas económicas, 31 (2013), 45-56. doi: 10.1080/07350015.2012.727721.

[18] j. I. Molinero. Regresiones cointegrantes de frecuencia mixta con retardo distribuido parsimonioso

estructuras. Revista de econometría financiera, 12 (2014), 584-614. doi: 10.1093/jjfinec/nbt010.

[19] R. kikuchi, t. arriba, S. Obayashi, h. apesta, h. Oikawa & A. Misumi. Previsión inmediata

Algoritmo para campos de viento utilizando pronósticos conjuntos y datos de vuelo de aeronaves.. Meteorológico

Aplicaciones, 25 (2018), 365-375. doi: 10.1002/se reunió.1704.

[20] A. Dupre, PAG. Drobinski P., j. badosa, C. Briar & PAG. Tanques. El valor económico del viento

pronóstico de energía. Energías, 13 (2020), 5266. doi: 10.3390/es13205266.

[21] I. kútiev, PAG. Muhtarov, B. Andonov & R. advertencia. Modelo híbrido para pronóstico inmediato y

pronosticar el índice K. Revista de Física Atmosférica y Solar-Terrestre, 71 (2009), 589-

596. doi: 10.1016/j.jastp.2009.01.005.

[22] Y. Wei & METRO. C. Chen. Previsión del flujo de pasajeros del metro a corto plazo con modo empírico

descomposición y redes neuronales. Investigación en transporte Parte C Tecnologías emergentes,

21 (2012), 148-162. doi: 10.1016/j.trc.2011.06.009.

[23] METRO. En, q. Él & j. gao. Previsión del flujo de pasajeros del metro en función de la ocurrencia de eventos con

redes sociales. Transacciones IEEE sobre sistemas de transporte inteligentes, 18 (2017), 1623-1632.

doi: 10.1109/TETAS.2016.2611644.

[24] V. Kuzin, METRO. Marcelino & C. Schumacher. MIDAS vs.. VAR de frecuencia mixta: Previsión inmediata

PIB en la zona del euro. Revista internacional de previsión, 27 (2011), 529-542. doi:

10.1016/j.ijforecast.2010.02.006.

[25] mi. andrea, mi. Ghysels, A & Kourtellos. ¿Deberían los pronosticadores macroeconómicos utilizar diariamente

datos financieros y cómo?. Revista de negocios & Estadísticas económicas, 31 (2013), 240-251. doi:

10.1080/07350015.2013.767199.

[26] F. corsi. Un modelo simple aproximado de memoria larga de volatilidad realizada. Revista de Finanzas

Econometría, 7 (2009), 174-196. doi: 10.1093/jjfinec/nbp001.

yo

D
oh
w
norte
oh
a
d
mi
d

F
r
oh
metro
h

t
t

pag

:
/
/

d
i
r
mi
C
t
.

metro

i
t
.

mi
d
tu
d
norte

/

i

t
/

yo

a
r
t
i
C
mi

pag
d

F
/

d
oh

i
/

i

/

.

/

t

1
0
1
1
6
2
d
norte
_
a
_
0
0
2
1
5
2
1
2
7
0
2
5
d
norte
_
a
_
0
0
2
1
5
pag
d

.

/

t

i

F

b
y
gramo
tu
mi
s
t

t

oh
norte
0
7
S
mi
pag
mi
metro
b
mi
r
2
0
2
3

Inteligencia de datos recién aceptada MS.
https://doi.org/10.1162/dint_a_002155

[27] h. Bahcivan & C. C. Karaján. Dinámica de correlación de alta frecuencia y día de la semana.

efecto: Un enfoque basado en puntuaciones en una bolsa de valores de un mercado emergente. Revisión internacional

de Análisis Financiero, 80 (2022), 102008. doi: 10.1016/j.irfa.2021.102008.

[28] A. Richardson, t. mulder & t. Vehbi. Previsión inmediata del PIB mediante algoritmos de aprendizaje automático:

Una evaluación en tiempo real. Revista internacional de previsión., 37 (2021), 941-948. doi:

10.1016/j.ijforecast.2020.10.005.

[29] mi. Ghysels & A. Hijo. Previsión de volatilidad y ruido de microestructura.. Diario de

Econometría, 160 (2011), 257-271. doi: 10.1016/j.jeconom.2010.03.035.

Biografía del autor

Dr. Xuerong Li, profesor asistente de la Academia de Matemáticas y

Ciencia de sistemas, Academia China de Ciencias. Ella recibió el B.E..

Licenciatura de la Universidad Renmin de China y Ph.D.. grado de

Universidad de la Academia de Ciencias de China en 2013 y 2019

respectivamente. Sus intereses de investigación se encuentran en el área de la economía.

previsión y aprendizaje automático.

yo

D
oh
w
norte
oh
a
d
mi
d

F
r
oh
metro
h

t
t

pag

:
/
/

d
i
r
mi
C
t
.

metro

i
t
.

mi
d
tu
d
norte

/

i

t
/

yo

a
r
t
i
C
mi

pag
d

F
/

d
oh

i
/

i

.

/

/

t

1
0
1
1
6
2
d
norte
_
a
_
0
0
2
1
5
2
1
2
7
0
2
5
d
norte
_
a
_
0
0
2
1
5
pag
d

.

t

/

i

F

b
y
gramo
tu
mi
s
t

t

oh
norte
0
7
S
mi
pag
mi
metro
b
mi
r
2
0
2
3

Profe. wei shang, profesor asociado de la Academia de Matemáticas y

Ciencia de sistemas, Academia China de Ciencias, ingeniero jefe de

Centro de ciencia de previsión, Academia China de Ciencias. Ella

tiene un doctorado del Instituto de Tecnología de Harbin. Su investigación se centra

sobre seguimiento macroeconómico y alerta temprana, Datos de Internet

Minería, Comercio electrónico y tecnología y desarrollo de la información.. Ella

publicó sus investigaciones en importantes revistas como Decision Support Systems, Electrónico

Investigación y aplicaciones, y revisión de información en línea. Es la investigadora principal de

tres proyectos regulares de la Fundación Nacional de Ciencias de China, así como un proyecto ICT4D de

Centro de investigación para el desarrollo de la información (Canadá).

Inteligencia de datos recién aceptada MS.
https://doi.org/10.1162/dint_a_002155

Profe. Xun Zhang, profesor asociado de la Academia de Matemáticas y

Ciencia de sistemas, Academia China de Ciencias. Ella recibió el B.E..

Licenciatura de la Universidad Renmin de China y Ph.D.. grado de

Academia de Matemáticas y Ciencias de Sistemas, Academia China de

Ciencias en 2004 y 2009 respectivamente. Sus intereses de investigación están en la

Área de previsión macroeconómica y economía energética..

Shan Baoguo es el vicepresidente del Instituto Estatal de Investigación de Energía de la Red

y un ingeniero senior a nivel de profesor. Recibió su título de bachiller y

Maestría de la Universidad de Energía Eléctrica del Norte de China en 1993 y

1997, respectivamente. Sus intereses de investigación son el análisis energético y

pronóstico, gestión del lado de la demanda de energía.

Dr. Wang Xiang es economista senior de State Grid Energy Research.

Instituto. Recibió su licenciatura de la Universidad de Jilin en 2011 y

su doctorado de la Universidad de Nankai en 2014. Sus intereses de investigación

son análisis y pronósticos macroeconómicos y del mercado energético.

yo

D
oh
w
norte
oh
a
d
mi
d

F
r
oh
metro
h

t
t

pag

:
/
/

d
i
r
mi
C
t
.

metro

i
t
.

mi
d
tu
d
norte

/

i

t
/

yo

a
r
t
i
C
mi

pag
d

F
/

d
oh

i
/

i

t

.

/

/

1
0
1
1
6
2
d
norte
_
a
_
0
0
2
1
5
2
1
2
7
0
2
5
d
norte
_
a
_
0
0
2
1
5
pag
d

.

/

t

i

F

b
y
gramo
tu
mi
s
t

t

oh
norte
0
7
S
mi
pag
mi
metro
b
mi
r
2
0
2
3Inteligencia de datos recién aceptada MS. imagen
Inteligencia de datos recién aceptada MS. imagen
Inteligencia de datos recién aceptada MS. imagen
Inteligencia de datos recién aceptada MS. imagen
Inteligencia de datos recién aceptada MS. imagen
Inteligencia de datos recién aceptada MS. imagen

Descargar PDF