13 Interpretation
Методы интерпретации нейронных сетей. Градиентные методы: GradCAM, Integrated gradients, Noise Tunnel. Методы на основе механизма внимания: матрица внимания, CLEAR, SCOUTER.¶
Методы интерпретации нейронных сетей¶
Нейронные сети представляют собой сложные математические модели, которые могут обучаться и совершать прогнозы на основе большого количества данных. Однако одним из недостатков таких моделей является их "черный ящик" - природа, которая делает интерпретацию их предсказаний сложной задачей. Чтобы решить эту проблему, были разработаны различные методы интерпретации нейронных сетей.
Градиентные методы¶
GradCAM (Gradient-weighted Class Activation Mapping)¶
GradCAM использует градиенты, выходящие из последнего сверточного слоя в сети, чтобы понять, какие особенности на изображении были важны для прогноза.
Для вычисления GradCAM используется следующая формула:
где \(A^k\) - активация \(k\)-го канала, \(\alpha_k^c\) - веса, определяемые градиентами класса \(c\) по отношению к каналу \(k\) (вычисляются путем глобального усреднения градиентов), а \(ReLU\) обеспечивает сохранение только позитивных вкладов.
Integrated Gradients¶
Integrated Gradients, предложенный Sundararajan и соавторами, объясняет разницу между выходами модели на базовом и целевом входе через интеграцию градиентов модели вдоль пути от базового до целевого входа.
Математически метод определен следующим образом:
где \(x\) - целевой вход, \(x'\) - базовый вход, \(F\) - модель, а \(i\) обозначает \(i\)-й элемент входа.
Noise Tunnel¶
Noise Tunnel - это метод, который используется для оценки неопределенности в интерпретации модели путем добавления шума к входным данным вдоль пути интеграции. Он может быть применен к любому методу атрибуции.
Метод атрибуции, модифицированный при помощи Noise Tunnel, может быть записан следующим образом:
где \(x\) - входные данные, \(\text{Attribution}(x)\) - атрибуция оригинального входа, а \(\mathcal{N}(0, \sigma^2)\) - гауссовский шум с нулевым средним и стандартным отклонением \(\sigma\).
Методы на основе механизма внимания¶
Матрица внимания¶
Матрица внимания используется в трансформерных моделях и позволяет модели сосредоточиться на определенных частях входных данных при создании выходных данных.
Матрица внимания вычисляется следующим образом:
где \(Q\), \(K\) и \(V\) - матрицы запросов, ключей и значений соответственно, а \(d_k\) - размерность ключей.
CLEAR (CLass-Enhanced Attentive Response)¶
CLEAR - это механизм, который улучшает процесс аттеншена, вводя классовые сигналы в матрицу внимания.
Формула для вычисления CLEAR представлена ниже:
где \(C\) - классовый сигнал.
SCOUTER (Score-COUnt-based aTtEntion for deep Rule)¶
SCOUTER - это метод интерпретации моделей глубокого обучения, который строит условные правила с помощью аттеншен-механизма, основанного на подсчете оценок. Этот метод основан на гипотезе, что важность признака должна быть выше, если он часто активируется при предсказании определенного класса.
SCOUTER использует следующую формулу для расчета важности:
где \(F\) - признак, \(c\) - класс, \(N\) - количество входных образцов, \(\text{Count}(F_i, c)\) - количество активаций признака \(F_i\) при предсказании класса \(c\), а \(\text{Score}(F_i, c)\) - средний вклад признака \(F_i\) в предсказание класса \(c\)
.