원자 간 퍼텐셜과 머신 러닝

화학 2020년 04월 12일

최근 COVID-19 전염병의 확산으로 인해 제약 분야에서의 머신 러닝(Machine Learning) 기술이 주목을 받고 있다. 머신 러닝 기술을 이용하면, 실험에서 생성되는 방대한 데이터의 특징을 효율적으로 판단할 수 있을 뿐만 아니라, 물질의 특성과 반응을 예측할 수도 있어 화학 연구에서도 널리 사용되고 있다. 그 중, 머신 러닝 기술이 활발히 적용되고 있는 화학 분야 중 하나는 원자 간 퍼텐셜(Interatomic Potential)의 연구이다. 화학적 원리를 중심으로 최근 원자 간 퍼텐셜 연구에서의 머신 러닝에 대해 알아보자.

원자 간 퍼텐셜

원자 간 작용하는 힘은 원자 간의 퍼텐셜 에너지로부터 파악할 수 있다. 두 개의 수소 원자를 예로 들면, 두 원자가 아주 멀리 떨어져 있을 때의 상호작용은 무시할 수 있다.이때 두 원자가 가까워지면, 퍼텐설 에너지는 원자 간의 인력으로 인해 감소하고, 결합의 평형 거리(\(\ce{H2}\)의 평균 결합 길이)에서 최소값을 가진다. 두 원자의 거리가 평형 거리보다 가까워지면, 척력이 우세하여 퍼텐셜 에너지가 증가한다. 수소 원자의 경우에는 개수가 적고, 대칭인 경우이므로 퍼텐셜의 예측이 비교적 간단하여 레너드-존스(Lennard-Jones) 퍼텐셜 등의 모델로 근사가 가능하다. 다음은 레너드-존스 퍼텐셜로, 두 원자간의 거리 \(r\)에 따른 퍼텐셜 \(V(r)\)를 실험적인 상수인 퍼텐셜 우물의 최소값 \(\varepsilon\)과 평형 거리 \(\sigma\)로 나타낸 식이다.

\[  V(r) = 4 \varepsilon \left[ \left( \frac{\sigma}{r} \right)^{12} - \left( \frac{\sigma}{r} \right)^{6} \right]\]

위 모델은 단순하지만, 거리 \(r\)만을 변수로 가지며, 원자 2개의 한 쌍만 고려할 수 있다. 이로 인해 실제 물질이 가지는 여러 특성을 설명할 수 없는데, 예를 들어 금속의 탄성계수를 구할 수 없다. 그 이유는 실제 분자는 쌍으로만 상호작용하지 않기 때문이다. 이렇게 보다 복잡한 분자 구조는 더욱 많은 변수가 존재한다. 공유 결합이 있는 경우에는 분자의 종류와 거리 뿐만 아니라, 위치에 인해 퍼텐셜이 바뀌게 된다. 공유 결합이 없어도 반데르발스 힘, 쿨롱 힘 등이 거리 등의 변수에 의해 바뀐다. 수많은 분자에 대해 다양한 변수를 모두 이론적, 실험적으로 고려하기는 무리가 있다. 이를 해결하기 위해 최근 사용되고 있는 기술이 바로 머신 러닝이다.

ML 퍼텐셜

이렇게 많은 변수에 대한 퍼텐셜의 함수는 퍼텐셜 에너지 곡면(Potential Energy Surface)으로 표현된다. 거리와 같이 퍼텐셜의 변수가 1개일 때에는 곡선으로 나타내어지지만, 퍼텐셜 에너지 곡면은 변수가 여러 개이므로 다차원의 곡면으로 나타난다. 많은 변수를 이러한 하나의 곡면으로 표현하는 것은 계산적으로 복잡한 과정이지만, 머신 러닝을 적용하면 효율적으로 계산할 수 있다.

\[ V_{\textrm{total}} = \sum\limits^{n}_{i=1} F(\textbf{q}_i)\]

위 식은 머신 러닝과 퍼텐셜 에너지 곡면의 원리를 나타낸 식이다. \(n\)개의 원자가 있을때, 머신 러닝 모델 \(F\)를 통해 각 원자가 총 퍼텐셜 \(V_{\textrm{total}}\)에 기여하는 정도를 계산한다. \(\textbf{q}_i\)는 \(i\)번째 원자의 종류, 거리, 각도 등의 정보를 담고 있는 벡터로, 이 벡터의 차원은 곧 퍼텐셜 에너지 곡면의 축의 개수와 같다.  \(F\)는 퍼텐셜 에너지 곡면으로, \(i\)번째 원자의 \(\textbf{q}_i\)를 변수로 가지고, 각 원자가 총 퍼텐셜에 기여하는 정도를 결과값으로 가진다. 이때 \(F\)의 형태는 데이터를 가지고 통계적 과정을 통해 학습시켜 정해지고, 이는 머신 러닝의 모델이다. 이렇게 구한 퍼텐셜은 ML 퍼텐셜이라 불린다.
ML 퍼텐셜을 이용하면 이전에는 가능하지 않았던 퍼텐셜 에너지 곡면을 구할 수 있지만, 이 또한 한가지 중요한 가정의 결과이다. 퍼텐셜 에너지 곡면을 구하고 머신 러닝 과정을 위해 원자핵과 전자의 운동을 따로 취급하는데, 이를 보른-오펜하이머(Born-Oppenheimer) 근사라 부른다. 이는 원자핵의 질량이 전자의 질량보다 \(10^3\)배 이상 크고, 원자핵의 운동이 전자의 운동보다 훨씬 느리기 때문에 가능한 근사이다. 보른-오펜하이머 근사는 퍼텐셜 에너지 곡면의 근본이지만, 항상 성립하지는 않는다. 하지만 이 근사 없이는 원자핵과 전자의 모든 상호작용을 고려해야 하여 계산 복잡도의 문제가 발생하므로, ML 퍼텐셜의 연구에서는 기본적인 가정으로 취급한다.
ML 퍼텐셜은 데이터를 기반으로 학습되기 때문에, 여러 분야에서 필요한 계산을 하나의 방법으로 광범위하게 적용할 수 있다.

참고 문헌

[1] Principles of Modern Chemistry, 8th Edition - Oxtoby, Gillis, Butler

Great! You've successfully subscribed.
Great! Next, complete checkout for full access.
Welcome back! You've successfully signed in.
Success! Your account is fully activated, you now have access to all content.