loading

PC.Div.Soft/News

AMD Zen, FMA4 지원, 표기는 안 됨

나에+ 2018. 10. 16. 19:53
반응형

https://www.techpowerup.com/248560/amd-zen-does-support-fma4-just-not-exposed

- https://www.youtube.com/watch?v=YAoaSuq1E8w

https://www.agner.org/optimize/blog/read.php?i=838


공식적으론 AMD의 Zen CPU 마이크로 아키텍처에서 FMA(fused multiply add)3 지원은 유지했지만 FMA4 명령어 세트 지원이 사라졌었는데요, Level1Tech에서 Zen CPU 마이크로 아키텍처에서 FMA4 명령어를 지원한다는 걸 밝혀냈습니다. OS에서 표시(노출)되지는 않지만요. FMA는 선형 대수를 계산하는 효율적인 방법으로, SSE3나 SSE4와는 달리 명령어 세트 버전을 나타내는 게 아니라 뒤에 붙는 숫자는 명령어당 피연산 함수의 갯수를 나타냅니다. 이 FMA3 명령어는 AMD가 2012년에 FX시리즈에, Intel은 Haswell(2013)에 투입했었죠.


왜 AMD가 Zen에서 FMA4 지원을 숨겼는지는 확실치 않지만 33% 정도 더 효율적임에도 불구하고 이를 숨긴 이유에 일부 개발자들은 AMD가 구현한 FMA4에 버그가 있다고 추측한다고 합니다. 일찍이 인텔이 FMA3를 도입하면서 많은 인기를 끌었고, 오랜 시간이 지나도록 더 안정적이었고요.


Level1Tech는 OpenBLAS FMA4 테스트 프로그램을 사용해 Zen 프로세서에서 FMA4 명령을 사용하면 '잘못된 명령어' 오류가 아니라 프로세서가 작업을 완료한다는 걸 확인했습니다. 흥미로운 점은 이러한 FMA4 지원이 CPUID에서 확인할 수 없고, 운영체제 조차도 프로세서가 이를 지원하는지 모른다는 점이죠. 아무튼 선형 대수학에서 FMA4가 단정밀도 ,배정밀도 모두에서 AVX보다 더 효율적임이 증명되었습니다.


반응형