- https://www.techpowerup.com/248560/amd-zen-does-support-fma4-just-not-exposed
- https://www.youtube.com/watch?v=YAoaSuq1E8w
- https://www.agner.org/optimize/blog/read.php?i=838
공식적으론 AMD의 Zen CPU 마이크로 아키텍처에서 FMA(fused multiply add)3 지원은 유지했지만 FMA4 명령어 세트 지원이 사라졌었는데요, Level1Tech에서 Zen CPU 마이크로 아키텍처에서 FMA4 명령어를 지원한다는 걸 밝혀냈습니다. OS에서 표시(노출)되지는 않지만요. FMA는 선형 대수를 계산하는 효율적인 방법으로, SSE3나 SSE4와는 달리 명령어 세트 버전을 나타내는 게 아니라 뒤에 붙는 숫자는 명령어당 피연산 함수의 갯수를 나타냅니다. 이 FMA3 명령어는 AMD가 2012년에 FX시리즈에, Intel은 Haswell(2013)에 투입했었죠.
왜 AMD가 Zen에서 FMA4 지원을 숨겼는지는 확실치 않지만 33% 정도 더 효율적임에도 불구하고 이를 숨긴 이유에 일부 개발자들은 AMD가 구현한 FMA4에 버그가 있다고 추측한다고 합니다. 일찍이 인텔이 FMA3를 도입하면서 많은 인기를 끌었고, 오랜 시간이 지나도록 더 안정적이었고요.
Level1Tech는 OpenBLAS FMA4 테스트 프로그램을 사용해 Zen 프로세서에서 FMA4 명령을 사용하면 '잘못된 명령어' 오류가 아니라 프로세서가 작업을 완료한다는 걸 확인했습니다. 흥미로운 점은 이러한 FMA4 지원이 CPUID에서 확인할 수 없고, 운영체제 조차도 프로세서가 이를 지원하는지 모른다는 점이죠. 아무튼 선형 대수학에서 FMA4가 단정밀도 ,배정밀도 모두에서 AVX보다 더 효율적임이 증명되었습니다.
'PC.Div.Soft > News' 카테고리의 다른 글
Intel Xeon W-3175X, IHS와의 결합에 솔더링(STIM)이 아닌 써멀 유지 (0) | 2018.10.16 |
---|---|
Intel, 새로운 데스크톱 프로세서에서 스펙터/멜트다운 수정, Core-X는 좀 더 기다려야 (0) | 2018.10.11 |
NVDIA, 기계 학습을 GPU로 가속하는 오픈 소스 플래폼 RAPIDS (0) | 2018.10.11 |