AMD تُقدم المعمارية الرسومية الجديدة …

في أحد أحدث المؤتمرات التقنية خرجت علينا شركة AMD بمفاجئة كاملة جديدة من العيار الثقيل، والذي لا يتكرر إلا مرات قليلة كل فترة وفترة …


هذا المؤتمر هو مؤتمر AMD Fusion Developer Summit واختصاره “AFDS” والذي تخصصه AMD للمطورين، ويدور حول مفهومها لمستقبل المعالجة والقائم على مبدأ Fusion، وهو يعني دمج كل من المعالج المركزي CPU والرسومي GPU في شيء واحد يُدعى وحدة تسريع المعالجة APU … هذا الدمج لن تتمكن AMD بل ولا يمكن تنفيذه بين ليلة وضحاها بل تحتاج AMD لتحقيقه إلى الانتقال على مراحل طويلة الأمد الزمني …


كانت البداية مع معالجات Liano وهو يمثل الجيل الأول من طرح AMD لمفهوم “الدمج-الصهر: Fusion” … معالجات ليانو اعتمدت على وضع المعالج الرسومي والمركزي على رقاقة سيلكون واحدة … وفي هذه المرحلة استعملت AMD حلا رسوميا مبنيا على ما تستعمله حاليا في بطاقاتها الرسومية وليس شيئا آخر … {وكل من المعالجين المركزي والرسومي من الممكن أن يستعملا نفس الموارد وهذا من الفروق الأساسية بين Llano و SNB.} *CR@N$H
مما يقلل من الفوائد العائدة من هذا الدمج هو أن معمارية AMD للمعالج الرسومي الحالية قليلة الكفاءة في التجاوب مع مفهوم GPGPU والذي يعني استغلال المعالج الرسومي لمعالجة التطبيقات العادية وليس الرسومية فحسب … ومعماريتها في المعالج المركزي الحالي أيضا غير مبنية على اساس الدمج.

إذن لا بدّ من التغيير ومن هُنا أتت الخطوة التالية، الإرتقاء بالمعمارية الرسومية لتصبح أكثر كفاءة في القيام بالأعمال الحسابية والرسومية أيضا، وتقترب خطوة أخرى من تحقيق ما تسعى له AMD من الدمج الكامل، بحيث لا نعود نفرق بين ال CPU و ال GPU على رقاقة السيليكون. ما سنستعرضه اليوم سيسمح ل AMD بالانتقال الى المرحلة التالية من الدمج في المستقبل حيث لدى الشركة الآن معمارية Bulldozer للمعالجات المركزية والتي لديها قدرة أعلى من المعمارية الحالية التي تم بناء ليانو على أساسها وسيكون لدى الشركة ايضا الجيل الجديد من المعالجات الرسومية …

في مؤتمرها الأخير استعرضت AMD ما اطلقت عليه اسم القلب الرسومي القادم GCN … وهذا سيكون محور الكلام فيما يلي ..

مُقدمة ضرورية:

اسمحوا لي ان استعمل هذه الكلمات العربية (المصطلحات) بدلا من المصطلحات الأجنبية: أهمها وسيتكرر اكثر من مرة هو :

1-
ALU: ساستبدلها بعبارة “وحدة حسابية” … وهذه هي ما نعرفه باسم المظلل أو وحدة التظليل ويمكنها القيام بحسابات النقطة العائمة بدقة 32 بت … و64 بت بنسبة معينة. -اعلم ان اساس معنى ال ALU هو الحسابات الصحيحة، ولكن هذا المصطلح هو ما استعمله اناند، وعلل استعماله، من يريد التوسع ليراجع المقال الأصلي الرابط في آخر الموضوع-.
2-
(Compute Unit (CU: واستعملتُ بدلا منها وحدة حساب.
3-
wavefront: حُزمة
4-
vector: مُتجه …
5-
غيرُ ذلك وأينما ذكرت مصطلحا عربيا فساكتب بديله الأجنبي بجانبه على الأقل للمرة الأولى.



حتى نفهم ما قامت به AMD من تغييرات في القلب القادم يجب أن نمر على
القلب القديم (الحالي)
:
ونتذكر قليلا حول تركيبه …

اعتادت AMD منذ زمن R300 المعروف ب (Radeon 9700 series) على ان تبني معالجاتها على أساس ما يُعرف ب VLIW5، حيث ان التطبيقات الرسومية كانت تعتمد على حساب اربع نقط قيمية component dot product (مثل: س ص ع ز ؛الابعاد) وقيمة خاصة (مثل: الجيب واللوغارتيم)… ورغم إطلاق DX10 وما يعرف ب unified shaders وتعني ان يقوم المظلل بكل أنواع العمليات -كما نراه في معالجات نفيديا- … فإن AMD استمرت ببناء معالجاتها بنفس الأسلوب وهو ان تبنيها على أساس 4+1 … فكنا نعرف عدد المظللات unified shaders في بطاقات AMD من خلال قسمة عدد ما تسميه AMD ب Radean core او shaders على 5 أو 4 -حسب البطاقة-.

فمثلا بطاقة من AMD تحوي 400 وحدة تظليل فإنها حقيقة لا تحوي سوى 80 مظلل unified shaders … وهذا ناتج على أن وحدة التظليل التي نقلتها AMD من DX9 إلى DX10 لا يمكنها العمل كمظلل حقيقي unified shaders ولكن عندما تجمع AMD الوحدات الخمسة معا فإنها تقوم بوظيفة المظلل المعياري unified shaders كاملة ولا ينقصها شيء. ولكن هذه الطريقة في بناء المعالج الرسومي كانت تؤدي الى ضياع الكثير من طاقة المعالج لأن التعليمات التي يستلمُها عادة لا تكون مثالية لبنيته …

حاولت AMD تقليل هذا الفقد من خلال برامج القيادة الخاصة بها قدر المستطاع ونجحت بذلك في المجال الرسومي فكانت لبطاقات 4+1 قدرات عالية جدا في الالعاب ومن منى ينسى اداء ال 4800 و 5800 و 6800 … ولكن في السنوات الأخيرة بدأ العالم يتجه إلى استغلال المعالجات الرسومية لغير ما أُسست له بُنية 4+1، هذا التوجه كان في استغلال المعالج الرسومي في تنفيذ تعليمات ليست رسومية وهنا ظهر عوار تصميم 4+1 … حاولت AMD كثيرا في تحسين تنفيذ معالجاتها الرسومية للتعليمات غير الرسومية ولكن لم تتمكن من التقدم في هذا المجال كثيرا … وإن القينا نظرة على منافسها في هذا المجال شركة نفيديا فسنجد انها قدمت مظلل حقيقا (معياريا) منذ معالج G80 وبطاقات 8800 واول طرح لبطاقات تدعم DX10 وكان ذلك في عام 2006 … خلال الخمسة اعوام المنصرمة تمكنا من رؤية كيف تتفوق بطاقات نفيديا على AMD في تنفيذ التعليمات غير الرسومية ومن اشهر الأمثلة على ذلك مشروع الطي F@H وبرامج تحرير الصور والفيديو وغيرُ ذلك. وسنعود فيما بعد للتطرق أكثر إلى ال 4+1 …

أُشير هُنا إلى أن AMD حاولت ان تغير من بنية معالجاتها فظهر لنا 4 (1) بدلا من 4+1 وربما كان مرحليا أو تجريبيا ولم يحقق شيئا يذكر في صعيد الحسابات غير الرسومية … على كل حال قررت الشركة الإنتقال إلى شيء آخر تماما ولكنها ومرة أخرى لم تستغن عن مفهوم 4+1 … - أقول ذلك مُزاحا، سأشرح التشابه بعد قليل- ولكن بشكل مُغاير تماما لما كان موجودا في المعالجات السابقة …


كيف كانت تُبني معالجات AMD الرسومية …

لندرك ذلك سنرتفع قليلا قليلا إلى أعلى …

هذا بناء المظلل المعياري unified shaders:

بنية المظلل في بطاقات AMD عامة على أساس VLIW5





بنية المظلل في بطاقات 6900 على أساس VLIW4




إن ارتفعنا أكثر سنجد أن AMD قد جمّعت كلّ 16 مظلل في قطاع واحد يُطلق عليه SIMD … كما يظهر في الصورة



تُجمع المظللات في SIMD ... كل SIMD يحوي 16 مُظللا كل مُظلل مكون من 5 وحدات بإستثناء بطاقات 6900 مظللاتها مكونة من 4 وحدات.


بعد ذلك تضع AMD العدد الذي تشاءُه من تجمعات المظللات SIMD فنرى معالجات رسومية ب SIMD واحد كالمعالج المدمج الشهير 3200 وما اشتق منه … ومعالجات بإثنان من تجمعات SIMD واربعة وستة وهكذا …. فمثلا تأتي البطاقة 5870 ب 1600 وحدة معالجة/تظليل أي 1600/5 = 320 مُظلل معياري موزعة على 1600/80= 20 SIMD أو 320/16=20 SIMD … ويمكن رؤية ذلك في الصورة التالية


توزيع توضيحي لل SIMD في رقاقة rv870 أو HD 5870 ... وتظهر فيه التجمعات مبتدءة من صفر وحتى تسعة عشر.

نعود لقلة الكفاءة التي كانت تعاني منها معمارية AMD والتي كانت بالمعدل في حدود 68% من وحدات المعالجة في رقاقات AMD … كيف يحدث ذلك؟

في عالم المعالجات المركزية يتم القاء الطلبات إلى المعالج وهو يقوم بجدولتها وترتيبها وتنظيمها بحيث يصل إلى أفضل كفاءة ممكنة … بل ويمكن للمعالجات المركزية تنفيذ الطلبات بغير ترتيب حسب الأفضلية بما يُسمى اللاترتيب out of order وإختصارا OoO وهذا النظام يعطي للمعالج كفاءة عالية ولكنه يستهلك كما من الترانستورات والطاقة ولذلك لم تضعه انتل في معالجات Atom… بينما في المعالجات الرسومية يتم تنفيذ التعليمات بترتيب وتتابع بحيث لا يتم تنفيذ تعليمة إلا بعد تنفيذ قرينتها أولا … حاولت AMD تعويض هذا الخلل من خلال “المُترجم compiler: وهو البرنامج الذي يحول من مستوى لغة برمجية إلى آخر، وهنا يتم التحويل من لغات البرمجة إلى لغة 0،1″ … ولكن المحول قدراته محدودة على ترتيب الطلبات والتعليمات بحيث يرتبها قبل ارسالها للمعالج، ولكن متى ما خرجت من عنده إلى المعالج فلا مجال للتعديل أو التغيير على العكس مما يكون في حالة وجود أداة جدولة مدمجة في رقاقة المعالج نفسه.



نلاحظ انه سيتم تنفيذ خمسة حسابات دفعة واحدة من خلال الخمسة وحدات حسابية،
ولكن بعدها لن تقوم هذه الوحدات الخمس إلا باستلام عملية واحدة مما يعني أن اربعة وحدات حسابية تجلس الآن بلا عمل، وهكذا.


رغم ما قد يخطر ببالي أو ببالك، إلا أن ال VILW ممتاز جدا مع التطبيقات الرسومية كالالعاب، وهذا شيء رأيناه جليا وواضحا من خلال نجاح وتميز كل من الأجيال الثلاثة الاخيرة من AMD … ولكن رغم كل هذا التميز إلا أنه ضعيف مع الحسابات غير الرسومية كالتطبيقات العامة … ولكن ما الذي يدفع AMD لتغير معمارية موجهة للتطبيقات الرسومية إلى معمارية تخدم التطبيقات العامة؟

إجابة هذا السؤال تكمن في كلمة واحدة Fusion ف AMD كما قلت تريد ان تدمج ال CPU و GPU معا بشكل كامل في المستقبل المنظور ولن تتمكن من ذلك ما لم تعمل على تقريب الأنظمة وكسر الحواجز والعوائق … فلذلك تأت هذه المعمارية الجديدة كلبنة إضافية في صرح مفهوم Fusion …

من هُنا كان لا بدّ من أن تقول الشركة وداعا لكل من VLIW5 و VLIW4 … وتنتقل إلى مفهوم جديد تسميه AMD ب Non-VLIW SIMD


معا لنتعرف على النظام الجديد:


في البداية وعند النظر بشكل سطحي سنرى ان النظامين مُتشابهين ولكن حقيقة هُناك فروق عديدة بينهما أهمها أن ال VLIW يستعمل مفهوم المعالجة المتوازية على مستوى التعليمة instruction level parallelism (ILP) وعلى الخلاف من ذلك يستعمل النظام الجديد مفهوم المعالجة المتوزاية على مستوى خط المعالجة thread level parallelism (TLP). والأمر يُركز على اصلاح والتقليل من ضعف المعالج الرسومي في معالجة الحسابات العامة غير الرسومية، السؤال الآن كيف سيتمكن ال non-VILW SIMD من حلّ هذه المشكلة؟ للإجابة على هذا السؤال يجب ان نجيب السؤال اعلاه وهو ما هو النظام الجديد.

النظام الجديد سيستعمل SIMD حقيقي حسب مفهومه وليس حسب ما كان موجودا سابقا في معالجات AMD والتي كانت عبارة عن تجمعات من المظللات الخماسية/الرباعية … فال SIMD الجديد سيتكون من 16 وحدة حسابية ALU كما في الصورة:-



تركيب وحدة SIMD الجديد ... تلاحظون انه أصبح أبسط بدلا من ذاك المعقد المكون من 80 وحدة حساب و16 وحدة تفريع ...


ولكن هذا الSIMD مختلف تماما عن ذاك القديم والموجود في بطاقات AMD حاليا، في الصورة التالية سنجد ان وحدة المعالجة فعليا لم تعد ال SIMD كما كانت في المعالجات القديمة منذ جيل 2000 وحتى 6000 … بل أصبح ال SIMD جزءا من “وحدة معالجة: Compute Unit” … وهذه تفاصيلُها …


بنية وحدة الحساب التي ستكون جزءا من نواة بناء الأجيال الجديدة من الحلول الرسومية من AMD


في الصورة أعلاه نرى ان تركيب وحدة الحساب CU يتكون من أربع SIMD كل واحد مكون من 16 وحدة حسابية صغيرة ALU أي بمجمل 64 وحدة حسابية لكل وحدة حساب … وهذا يذكرنا بتركيب ال SIMD القديم والموجود في بطاقات 6900 المبنية على نواة Cayman حيث يحوي كل SIMD فيها على 64 وحدة حساب أيضا اما ال SIMD ما قبل Cayman فكل SIMD يحوي 80 وحدة حسابية.

بالإضافة إلى 64 وحدة حسابية بقدرة على حساب المتجهات vector هُناك وحدة لحساب القيم غير المتجهة scalar والهدف من إضافة هذه الوحدة الخاصة بالحسابات السهلة “القيمية scalar” هو زيادة الكفاءة في استغلال وحدات الحساب القادرة على حساب المتجهات بدلا من إضعاتها واستهلاكها في حساب القيم الجامدة والثابتة scalar …

ما الذي يعنيه التغيير من ال SIMD المعتمد على ال VILW إلى SIMD غير معتمد على VLIW … أعود وأذكر نفسي وإياكم بأن هدف AMD من هذا التغيير شيئان أولاهما: زيادة كفاءة معماريتها الرسومية وثانيهُما زيادة قدرتها على التعامل مع التطبيقات العامة المعتمدة على المعالج الرسومي GPGPU.


زيادة الكفاءة في استغلال العتاد: لنفهم ما قامت به AMD لنلق نظرة على هاتين الصورتين …


الحالة المثالية في وصول حُزم البيانات لل SIMD ... وهُنا نرى ان الترتيبن القديم والجديد يعملان 100% ...






حالة واقعية في وصول حُزم البيانات لل SIMD ...
وهُنا نرى ان في الترتيب القديم لم يتم إشغال سوى 75% من وحدات التظليل SPUs أو ALU، بينما في الجديد نسبة الإشغال 100%، رغم أنهما استلما نفس ترتيب الحُزم.

في المعالجات الرسومية الحالية في حال وصول حزم من البيانات المستقلة -غير المترابطة والمتعلقة ببعضها البعض- إلى معالج AMD الرسومي فإن كل حزمة تدخل إلى المعالج تكون قد دخلت بشكل نظمه برنامج القيادة، بينما في المعالجات القادمة GCN سيتم وضع موزع ومنظم داخلي على مستوي الرقاقة والترانستور مما سيسمح للمعالج بترتيب وتوزيع البيانات بآلية أكثر مرونة وكفاءة من السابق.

من اهم الأمور التي يجب الإنتباه لها هُنا أيضا هي أن: AMD وسعت عدد الحُزم wavefront من 4 إلى 40 . في المعمارية السابقة كانت تصل لكل SIMD في بطاقة مثل 6970 أربع حُزم من البيانات التي تحتاج إلى معالجة .. الآن تصل لكل وحدة حساب CU ما يبلغ 40 حُزمة وهذه الأربعون موزعة على الأربع SIMD بحيث يصل لكل SIMD داخل ال CU عدد 10 حُزم ليختار منها… وهذه زبدة سبب إنتقال AMD من SIMD المعتمد على VLIW إلى SIMD غير معتمد على VLIW .
بالتبعية أصبح المُترجم أقلُّ تعقيدا حيث تم رفع أمر تنظيم وترتيب scheduling المهام ونقل إلى المعالج الرسومي بحدّ ذاته، بحيث اصبح المنظم عتادا وليس برمجة. هذا الأمر لا يقلل فقط من تعقيد المحول compiler بل ويقلل ضغطه واستهلاكه للمعالج المركزي بالإضافة إلى أن ذلك يسمح له بالتركيز على أمور أخرى كالتوسع في اللغات التي يتمكن من النحويل منها أو اليها فالمعمارية الجديدة تدعم مثلا لغة ++C بدلا من اللغة الأقدم والأصعب C. أيضا أن مكتبة التعليمات العتادية instruction set architecture (ISA) أصبحت أقل تعقيدا مما يعني ان حل المشاكل debugging أصبح أيسر وأسهل.


أعلى قليلا … المصفوفات:

هل تذكرون عندما تكلمنا على الذاكرة المُخباة في وحدة الحساب CU من المستوى الأول وكتبتُ تحتها قائلا “متشركة مع أربع وحدات حساب” … ترى أي أربع وحدات؟ هذا ما سيظهر لنا في الصورة التالية:

المصفوفة ... لبنة بناء المعالجات المستقبلية ... تتكون من أربع وحد مشتركة في ذاكرة مُضمنة للقراءة فقط ...


هذا هو ما ستبني AMD معالجاتها القادمة عليه، فأقل حلّ رسومي سيحوي على الأقل واحدا من هذه المصفوفات… ويمكن إضافة القدر الذي نرغب به منها، لنضيف المزيد والمزيد من الأداء …
كل مصفوفة ستحوي 256 وحدة حسابية موزعة على 16 SIMD … ال 16 SIMD موزعة على 4 وحد حساب …

بالنسبة للمعمارية القادمة ككل فلم تتوسع AMD في مناقشة باقي الأجزاء .. ولكن يمكننا ان نضع هذا التصور العام جدا وسألخص بعد الصورة طبيعة كل جزء ووظيفته بسرعة …


مُخطط المعمارية الجديدة بالكامل ... وفيه أنرى ان القلب الرسومي الجديد جزء واحد من اجزاء عديدة ...

تركتُ هُنا المُصطلحات الإنجليزية الأصلية … ولم أعدل على الصورة نهائيا …
لسببين هُما أهمية ان نعرف المصطلح الإنجليزي وهذا امر في غاية الأهمية! والثاني انني لا أمتلك مصطلحا عربيا مناسبا وخصوصا لما سيرد هُنا أو أنني اشك في مناسبته ..

تعودنا من AMD على ان معالجاتها الرسومية والمركزية مرنة بحيث يمكنك خفضُها ورفعُها بسهولة فمثلا في معمارية فينوم رأينا منها فينوم X2 و X3 و X4 و X6 ونظرييا كان من الممكن أن نرى X5 … أو حتى X1 … نفس الشيء في المعالجات الرسومية … فجلّ ما تغيره AMD بين بطاقة 5870 و بطاقة 5850 مثلا هو عدد ال SIMD القديم -يحوي الواحد 80 وحدة حسابية- فتحذف إثنين اوو اربعة أو غيرُ ذلك حسب ما تريد من فرق في الأداء او غير ذلك. هذا الأمر كان معروفا وليس جديدا على معمارية AMD الجديد أن AMD نقلت قدرتها على تغيير العدد إلى أجزاء أخرى في المعالج الرسومي. فيمكن ل AMD أن تضيف العدد الذي تشاءه من ACE أو primitive pipelines أو ROPs …

مكونات المعمارية بجانب القلب الجديد GCN


ACE : Asynchronous Compute Engines : وهو يعمل كمسؤول عن الوحدات الحسابية بحيث يستلم الأوامر الموجهة للقلب الرسومي من النظام ويرسلها لوحد المعالجة. كما أنه المسؤول عن الأولويات –من يتقدم على من- task priority وتحديد المصادر resource allocation و التبديل context switching …

استعمال ال ACE يعمل على تنظيم المهام بغير ترتيبها الأصلي ولكنه لا يعتبر out-of-order بل in-order ولكي يتمكن من العمل على مهام متعددة في نفس الوقت يقوم باعادة ترتيب للمهام تبعا لأولويتها بطريقة مشابهه لما يحدث في معالجات ARM أو Atom من إنتل. النقطة الفاصلة هنا -حتى لا يحدث سوء فهم- هو ان المعالجات OoO يمكنها ان تعيد المهمة حتى لو تم ارسالها للمعالجة بينما في المعالجة التي تعمل بالاولويات فهي تحاول ان تنظم المهام قبل ارسالها للمعالجة، بحيث تحصل على افضل كفاءة ممكنة. كما يمكنكم التوقع فإن نظام OoO أقوى وأقدر وأكثر مرونة.

graphics command processor : وهو المسؤول عن حصد والحصول على ناتج عمل القلب الرسومي.

primitive pipelines: وهي مسؤولة عن تنفيذ الترصيع tessellation والتفاصيل المُجسمة geometry و المعالجة النهائية للأسطح والعديد من الأمور الأخرى. وعلى العكس من الحال سابقا فيمكن ل AMD ان تضع هنا عددا كبيرا من primitive pipelines في حين أنه في بطاقة 6970 لم يكن بامكان AMD سوى استعمال اثنين، مما يعني امكانية توفير قدرة هائلة بكل معنى الكلمة على معالجة التفاصيل المُجسمة والترصيع إن لزم الأمر.

ROPs : معالجات الرسم: وايضا عددها سيكون مرنا وقابلا للتوسع scalable ولكن يُتوقع ان يكون مُرتبط بعدد متحكمات الذاكرة …

partially resident textures (PRT): وهذا سيكون من مزايا المعمارية الجديدة حيث سيسمح للمطورين باستعمال إكساءات ضخمة دون انحدار الاداء، حيث تسمح هذه التقنية بأخذ جزء محدد من الاكساء ورفعه إلى الذاكرة فحسب … مما يعني أننا سنرى المزيد من الجودة العالية للإكساءات وازدياد حجوم الألعاب اكثر مما هي عليه. هذا الأمر لن يكون برمجيا كالحال عندما اطلق جون كارماك تقنية MegaTexture التي تقوم بعمل مُشابه ولكن برمجيا. مع ال PRT الأمر سيكون عتاديا.


بعض المزايا المهمة التي أعلنت عنها AMD:

أولا: دعم لغات برمجية عالية ك ++C …
ثانيا: مكتبة عتادية ISA تستعمل ذاكرة موحدة unified memory : معنى هذا ان المعالج الرسومي سيكون قادرا على استلام الأوامر من الذاكرة الرئيسة RAM مُباشرة دون الحاجة لمرورها باجزاء اخرى. هذا الامر سيكون له علاقة بتسهيل كتابة البرامج التي يُراد لها استغلال المعالج الرسومي.
ثالثا: IOMMU مضمنة في المعمارية القادمة .. هذا الأمر سيساعد على التوافق في العمل بين المعالج الرسومي والمركزي … ولكنه سيكون بحاجة ليتجاوب معه نظام تشغيل مناسب … {هذه الميزة تعتبر من خواص ال Visualzation وتسمح للمستخدم استخدام الDrivers الأصلية لعتاده في الأنظمة الوهمية مما يعطي دفعة كبيرة في الأداء المعتمد على العتاد "يعني السماح باستغلال قدرات البطاقات في الأنظمة الوهمية"} *
CR@N$H
رابعا: ECC : وهي خاصية مسؤولة عن اكتشاف وتصحيح الاخطاء أثناء نقل البيانات من الذاكرة الى النظام، ولوجود مزايا عالية كلغة ++C أتت الحاجة لزيادة دقة وموثوقية نتائج المعالج الرسومي فتمت إضافة هذه الخاصية. وإن كان لم يعرف بعد، هل ستكون كاملة، ام افتراضية كما في فيرمي.
رابعا: دعم حسابات النقطة العائمة بدقة 64 بت FP64: أيضا المعمارية تدعم FP64 بنسبة 50% أو 1/2 أي ان عدد الوحدات التي تدعم FP64 تبلغ نصف عدد الوحدات الحسابية ولكن من الممكن أن نرى 1/4 أو 1/8 … حسب ما تراه AMD مناسبا للسوق.


متى سنرى هذه المعمارية:

الأمر غير واضح تماما … ولكن يمكن القول اننا لن نراها مدمجة مع معالجات بلدوزر القادمة، فحتى تُدرك AMD سباق الوقت استعملت حلا رسوميا من فئة ما هو موجود في بطاقات Cayman في المعالج المنتظر من معمارية بلدوزر تحت الاسم الرمزي Trinity … لذلك من الممكن أن نرى هذه المعمارية في الجيل القادم من AMD للبطاقات الرسومية العالية ومن الممكن ان لا … لا يوجد ما هو مؤكد … أصلا حتى لو حصلنا على خبر يؤكد ان هذه المعمارية هي ما سيُستعمل في الجيل القادم من البطاقات الرسومية ك 7000 فحتى هذا الجيل لا نعلم متى ىسيصدر فعلا … بل ويمكن ل AMD أن تصدر جيلا هجينا مرة أخرى جزء منه بمعمارية والجزء الآخر بمعمارية اخرى كما حدث في بطاقات 6900 و 6800 …

بالنسبة لتصريحات AMD بخصوص انها ستصدر بطاقات جديدة بمعمارية جديدة (هُنا) في نهاية العام الجاري فلا أثق بها تماما وأخشى فعلا ان لا تتمكن AMD من فعلها ... حيث اتوقع أن نرى تأجيلات ومشاكل وخلافه كما حصل مع بلدوزر وفيرمي! خصوصا ان AMD ستنتقل إلى دقة تصنيع جديد ومعمارية جديدة ورُبما مُصنّع جديد؛ حيث قد تتوجه إلى GloFun ....... ولكن إن حصل واطلقت AMD بطاقات بهذه المعمارية المعتمدة على GCN قبل نهاية العام الجاري فسيكون هذا الأمر تطورا كبيرا في عالم المعالجات الرسومية، خصوصا إن كان الأداء الفعلي مشابه للمواصفات النظرية والتصورية والآمال المعقود عليه.


المصدر الأساس:
AMD’s Graphics Core Next Preview: AMD’s New GPU, Architected For Compute