Оптимизация поиска стран по IPv4 в MariaDB без LATERAL

Question

Как оптимизировать поиск стран по IPv4 в MariaDB без ключевого слова LATERAL для нескольких IP‑адресов?

Я использую MariaDB v10.11.15 (форк MySQL), который не поддерживает ключевое слово LATERAL, и мне нужно оптимизировать запрос, который ищет страны для 30 IPv4‑адресов.

Current IPv4 Lookup Query

sql

SELECT
    ips.country
FROM (
    SELECT *
    FROM ips 
    WHERE ip4_beg <= 36843009
    ORDER BY ip4_beg DESC
    LIMIT 1
    ) AS ips
WHERE ips.ip4_end >= 36843009;

Table Structure and Indexes

Таблица ips содержит миллионы диапазонов IPv4, определенных столбцами ip4_beg и ip4_end (включительно)
Диапазоны уникальны и не перекрываются, но могут иметь пробелы
Существует уникальный индекс по ips.ip4_beg

Performance Analysis

id  select_type table       type      p_keys   key      keylen  ref   rows     r_rows  filtered r_filtered  Extra
-------------------------------------------------------------------------------------------------------------------------
1   PRIMARY     <derived2>  ALL       NULL     NULL     NULL    NULL  2        1.00    100.00   100.00      Using where 
2   DERIVED     ips         range     idx_beg  idx_beg  4       NULL  1148647  1.00    100.00   100.00      Using where

На практике этот запрос ищет страну IP менее чем за 1 мс, используя только индекс по ips.ip4_beg.

Source Query for IPv4 Numbers

sql

SELECT 
     id_member, url, ip
FROM log_online
ORDER BY id_member
LIMIT 0, 30;

Существует уникальный индекс по log_online.id_member
Тип log_online.ip соответствует типу ips.ip4_beg и ips.ip4_end

The Problem

Мне нужно выполнить первый запрос (поиск страны по IPv4) для каждого log_online.ip, возвращаемого вторым запросом. Итоговый вывод должен содержать:

log_online.id_member
log_online.url
log_online.ip
ips.country

Attempted Solution with Correlated Subquery

sql

SELECT 
     id_member, url, ip,
     (SELECT
        innerq.country
      FROM (
             SELECT *
             FROM ips 
             WHERE ip4_beg <= lo.ip   -- Ссылка на lo.ip здесь не работает
             ORDER BY ip4_beg DESC
             LIMIT 1
           ) AS innerq
      WHERE innerq.ip4_end >= lo.ip
     )
FROM log_online AS lo
ORDER BY id_member
LIMIT 0, 30;

Alternative Approach

sql

SELECT 
     id_member, url, ip, 
     (
      SELECT
         country
      FROM ips 
      WHERE lo.ip BETWEEN ip4_beg AND ip4_end
     )
FROM log_online AS lo
ORDER BY id_member
LIMIT 0, 30;

Однако этот подход работает плохо:

id  select_type   table  type   p_keys   key        keylen  ref   rows     r_rows      filtered  r_filtered  Extra
--------------------------------------------------------------------------------------------------------------------------
1   PRIMARY       lo     index  NULL     id_member  3       NULL  531      30.00       100.00    100.00         
2   DEP SUBQUERY  ips    ALL    idx_beg  NULL       NULL    NULL  2418126  2418278.00  100.00      0.00      Using where

Добавление ORDER BY и LIMIT 1 улучшает производительность незначительно, но всё равно занимает ~4 минуты только для 30 IP:

id  select_type    table  type    p_keys   key        keylen  ref   rows     r_rows     filtered  r_filtered  Extra
---------------------------------------------------------------------------------------------------------------------------
1   PRIMARY        lo     index   NULL     id_member  3       NULL  410      30.00      100.00    100.00         
2   DEP SUBQUERY   ips    index   idx_beg  idx_beg    4       NULL  2418126  879673.03  100.00      0.00      Using where

Performance Requirements

Объединённые запросы не должны превышать время выполнения: second_query + first_query * 30

Поскольку второй запрос возвращает 30 строк, я ищу решение, которое сохраняет этот уровень производительности.

Future Considerations

Я планирую вернуть дополнительные столбцы из таблицы ips (из той же строки) с помощью JSON_OBJECT(), поэтому решение должно позволять получать несколько столбцов без выполнения отдельных подзапросов для каждого.

Question

Как эффективно выполнить поиск страны для каждого из 30 IPv4‑адресов, возвращаемых вторым запросом, сохраняя характеристики производительности исходного запроса поиска по IPv4?

Оптимизация поиска стран по IPv4 в MariaDB без LATERAL

Current IPv4 Lookup Query

Table Structure and Indexes

Performance Analysis

Source Query for IPv4 Numbers

The Problem

Attempted Solution with Correlated Subquery

Alternative Approach

Performance Requirements

Future Considerations

Question

Краткий ответ

Содержание

Понимание проблемы производительности

Оптимальное JOIN‑базированное решение

Шаг 1: Создайте временную таблицу с IP‑адресами

Шаг 2: Оптимизируйте JOIN‑запрос

Шаг 3: Продвинутая оптимизация с производным таблицей

Альтернативные техники оптимизации

1. Многодоменное чтение (MRR)

2. Учет оптимизации индексов

3. Переписывание запроса с EXISTS

Продвинутая оптимизация с многодоменным чтением

Рекомендации по окончательной реализации

Ожидаемые показатели производительности

Дополнительные варианты оптимизации

Источники

Заключение