پاور 10 ڪارڪردگي تڪڙي شروعات گائيڊ
(Power10 QSGs)
نومبر 2021
گھٽ ۾ گھٽ ياداشت
- هر پروسيسر ساکٽ لاء، گهٽ ۾ گهٽ 8 مان 16 DIMMs آباد ٿيل آهن
- ھڪڙي نوڊ ۾، گھٽ ۾ گھٽ 32 مان 64 DIMMs لاء آباد آھن
- 4-نوڊ سسٽم ۾، گھٽ ۾ گھٽ 128 مان 256 DIMMs آباد ٿيل آھن
DDIMM پلگ ضابطا
- گھٽ ۾ گھٽ ياداشت جي اجازت ڏيو (هر پروسيسر ساکٽ گھٽ ۾ گھٽ 8 مان 16 DIMMs آباد ٿيل آھن)
- هر پروسيسر جي تحت سڀئي DIMMs ساڳي صلاحيت هجڻ گهرجي
- فيچر اپ گريڊ 4 DDIMM جي واڌاري ۾ پيش ڪيا ويندا، جن مان سڀني جي ساڳي گنجائش آهي.
- ڏنل پروسيسر ماڊل سان ڳنڍيل سائيٽن ۾ پلگ ٿيل DDIMM جو واحد صحيح نمبر 8 يا 12 يا 16 آهي.
ياداشت جي ڪارڪردگي
- سسٽم جي ڪارڪردگي بهتر ٿي ٿي جيئن ميموري جي مقدار وڌيڪ DDIMM سلاٽ ۾ پکڙيل آهي. مثال طورampلي، جيڪڏهن 1TB هڪ نوڊ ۾ گهربل آهي، اهو بهتر آهي ته 64 x 32GB DIMMs هجن 32 x 64GB DIMMs کان.
- پلگ ان DIMMs جيڪي سڀئي ساڳيا سائيز آھن تمام اعليٰ ڪارڪردگي مهيا ڪندا
- سسٽم جي ڪارڪردگي بهتر ٿي ٿي جيئن وڌيڪ ڪواڊ هڪ ٻئي سان ملن
- سسٽم جي ڪارڪردگي بهتر ٿي ٿي جيئن وڌيڪ پروسيسر ڊي ڊي ايم ايمز هڪ ٻئي سان ملن
- سسٽم جي ڪارڪردگي هڪ گھڻن دراز سسٽم تي بهتر ٿي ٿي جيڪڏهن دراز جي وچ ۾ ياداشت جي صلاحيت متوازن آهي.
ميموري بينڊوڊٿ
DDIMM ظرفيت | نظرياتي MaxBandwidth |
32GB، 64 GB (DDR4 @ 3200 Mbps) | 409 GB/s |
128GB، 256 GB (DDR4 @ 2933 Mbps) | 375 GB/s |
خلاصو
- بهترين ممڪن ڪارڪردگيءَ لاءِ، عام طور تي سفارش ڪئي وئي آهي ته ميموري کي هڪجهڙائي سان نصب ڪيو وڃي سڀني سسٽم نوڊ درازن ۽ سسٽم ۾ سڀني پروسيسر ساکٽس تي. نصب ٿيل سسٽم پلانر ڪارڊن ۾ ميموري کي بيلنس ڪرڻ ميموري جي رسائي کي مسلسل طريقي سان قابل بڻائي ٿو ۽ عام طور تي توهان جي ترتيب جي بهتر ڪارڪردگي جو نتيجو آهي.
- جيتوڻيڪ وڌ ۾ وڌ ميموري بينڊوڊٿ حاصل ڪئي ويندي آهي سڀني ميموري سلاٽس کي ڀرڻ سان، مستقبل جي ميموري جي اضافي جي منصوبن تي غور ڪيو وڃي جڏهن اهو فيصلو ڪيو وڃي ته ڪهڙي ميموري فيچر سائيز کي استعمال ڪرڻ لاءِ شروعاتي سسٽم آرڊر جي وقت.
P10 ڪمپيوٽ ۽ ايم ايم اي آرڪيٽيڪچر
- 2x بينڊوڊٿ ملائي سمڊ*
- 8 آزاد فڪسڊ ۽ فلوٽ SIMD انجڻ في ڪور
- 4 - 32x ميٽرڪس رياضي جي رفتار *
- 4 512 بٽ انجڻ في ڪور = 2048b نتيجا / چڪر
- ميٽرڪس رياضي جي ٻاهرئين پراڊڪٽس سنگل، ڊبل ۽ گھٽ ٿيل سڌائي.
- MMA آرڪيٽيڪچر سپورٽ POWER ISA v3.1 ۾ متعارف ڪرايو
- سپورٽ SP، DP، BF16، HP، Int-16، Int-8 ۽ Int-4 صحت واري سطح.
P10 MMAA ايپليڪيشنون ۽ ڪم لوڊ انٽيگريشن
- ايم ايل ۽ ايڇ پي سي ايپليڪيشنون ڊينس لينر الجبرا جي حسابن سان، ميٽرڪس ضرب، ڪنوولوشنز، ايف ايف ٽي ايم ايم اي سان تيز ٿي سگهن ٿيون
- GCC ورجن >= 10 ۽ LLVM ورجن >=12 بلٽ انز ذريعي ايم ايم اي کي سپورٽ ڪري ٿو.
- OpenBLAS، IBM ESSL ۽ Eigen لائبريريون اڳ ۾ ئي P10 لاءِ MMA هدايتون سان بهتر ڪيون ويون آهن.
- مٿين BLAS لائبريرين ذريعي انٽرنيشنل ايپليڪيشنز، ايم ايل فريم ورڪ، ۽ اوپن ڪميونٽي پيڪيجز لاءِ ايم ايم اي جو آسان انضمام.
پاور پي سي ميٽرڪس- ملٽيپلي اسسٽ بلٽ ان افعال https://gcc.gnu.org/onlinedocs/gcc/PowerPC-Matrix-Multiply-Assist-Built-in-Functions.html
Matrix-Multiply Assist Best Practices Guide https://www.redbooks.ibm.com/Redbooks.nsf/RedpieceAbstracts/redp5612.html?Openورچوئل پروسيسرز
- سڀني شيئر ٿيل حصن جي حقدار ڪور جو مجموعو شيئر پول ۾ ڪور جي تعداد کان وڌيڪ نٿو ٿي سگھي
- پڪ ڪريو ته فريم تي ڪنهن به شيئر ٿيل ورچوئل پروسيسرز جي ترتيب ڏنل ورچوئل پروسيسرز جو تعداد شيئر پول ۾ ڪور جي تعداد کان وڌيڪ نه آهي.
- هڪ گڏيل ورهاڱي لاءِ ورچوئل پروسيسرز جو تعداد ترتيب ڏيو چوٽي جي گنجائش جي طلب کي برقرار رکڻ لاءِ
- گڏيل ورهاڱي لاءِ حقدار ڪورز جو تعداد ترتيب ڏيو انهي ورهاڱي جي سراسري استعمال لاءِ بهتر ڪارڪردگي لاءِ
- بهتر ميموري ۽ سي پي يو جي لاڳاپي کي يقيني بڻائڻ لاءِ (ورچوئل پروسيسر جي غير ضروري اڳڪٿين کان پاسو ڪريو)، شيئر ڪيل پول ۾ ڪور جي تعداد جي ويجهو سڀني شيئر پارٽيشنز جي حقدار ڪور جي رقم کي يقيني بڻايو.
پروسيسر مطابقت موڊ
- AIX لاءِ 2 پروسيسر مطابقت جا طريقا موجود آهن: POWER9 ۽ POWER9_base. ڊفالٽ آهي POWER9_base mode.
- لينڪس لاءِ 2 پروسيسر مطابقت جا طريقا موجود آهن: POWER9 ۽ POWER10 موڊ. ڊفالٽ آهي POWER10 موڊ.
- LPM ورهاڱي کان پوء، پروسيسر مطابقت واري موڊ کي تبديل ڪرڻ دوران پاور چڪر جي ضرورت آهي
پروسيسر فولڊنگ غور
- پاور 9 تي هلندڙ AIX ورهاڱي لاءِ، ڊفالٽ vpm_throughput_mode = 0، Power10 تي، ڊفالٽ vpm_throughput_mode = 2. ڪم لوڊ لاءِ ڊگھي هلندڙ نوڪريون آهن، اهو ممڪن طور تي بنيادي استعمال جي گھٽتائي ۾ مدد ڪري سگهي ٿو.
- وقف ٿيل ورهاڱي لاءِ هلندڙ AIX، ڊفالٽ vpm_throughput_mode = 0 ٻنهي Power9 ۽ Power10 تي.
LPAR صفحي جي ٽيبل جي ماپ غور
• ريڊيڪس پيج ٽيبل کي سپورٽ ڪيو ويو آهي شروع ٿيندڙ پاور10 تي هلندڙ لينڪس. اهو ممڪن طور تي ڪم لوڊ ڪارڪردگي بهتر ڪري سگهي ٿو.
حوالو:
IBM پاور سسٽم ڏانهن ڪم لوڊ لڏپلاڻ لاءِ اشارا ۽ صلاحون: https://www.ibm.com/downloads/cas/39XWR7YM
IBM پاور ورچوئلائيزيشن بهترين طريقا گائيڊ: https://www.ibm.com/downloads/cas/JVGZA8RW
پڪ ڪريو OS سطح موجوده آهي
Fix Central AIX، IBM i، VIOS، Linux، HMC ۽ F/W لاءِ تازيون تازه ڪاريون مهيا ڪري ٿي. ان کان علاوه، FLRT ٽول هر H/W ماڊل لاءِ تجويز ڪيل سطحون مهيا ڪري ٿو. توهان جي سسٽم کي تاريخ تائين برقرار رکڻ لاء اهي اوزار استعمال ڪريو. جيڪڏهن توهان سفارش ڪيل سطح تي نه ٿا وڃو، پوءِ IBM POWER10 پروسيسر-بنياد سسٽم دستاويز ڏانهن ڪم لوڊ منتقل ڪرڻ لاءِ اشارا ۽ تجويزن جي ڄاڻايل مسئلي واري حصي کي ڏسو.
AIX CPU استعمال
POWER10 تي، AIX OS سسٽم کي بهتر ڪيو ويو آهي بهترين خام ٿروپٽ لاءِ اعليٰ CPU استعمال تي جڏهن وقف ٿيل پروسيسرز سان هلندي هجي. جڏهن گڏيل پروسيسرز سان هلندي، AIX OS سسٽم کي CPU استعمال (pc) کي گهٽائڻ لاءِ بهتر ڪيو ويو آهي. جيڪڏهن گراهڪ کي CPU استعمال (pc) کي وڌيڪ گھٽائڻ جي ضرورت آهي، ڪم لوڊ کي ٽيون ڪرڻ لاءِ شيڊول ٽيونبل pm_throughput_mode استعمال ڪريو ۽ خام throughput بمقابله CPU استعمال جي فائدن جو جائزو وٺو.
NX GZIP
صلاح وٺڻtagPOWER10 سسٽم تي NX GZIP ايڪسلريشن جو LPAR POWER9 مطابقت واري موڊ ۾ هجڻ گهرجي (نه POWER9_base موڊ) يا POWER10 مطابقت واري موڊ ۾.
IBM i
پڪ ڪريو ته IBM I آپريٽنگ سسٽم جي سطح موجوده آهي. Fix Central IBM I، VIOS، HMC، ۽ firmware لاءِ تازيون تازه ڪاريون مهيا ڪري ٿي. https://www.ibm.com/support/fixcentral/
فرم ویئر
پڪ ڪريو ته سسٽم فرم ویئر جي سطح موجوده آهي. Fix Central IBM I، VIOS، HMC، ۽ firmware لاءِ تازيون تازه ڪاريون مهيا ڪري ٿي. https://www.ibm.com/support/fixcentral/
ميموري DIMMs
مناسب ميموري پلگ ان ضابطن تي عمل ڪريو. جيڪڏهن ممڪن هجي، مڪمل طور تي ميموري DIMM سلاٽ کي آباد ڪريو ۽ ساڳئي سائيز جي ميموري DIMMs استعمال ڪريو.
پروسيسر SMT سطح
مڪمل صلاح وٺڻtagپاور 10 سي پي يوز جي ڪارڪردگيءَ مان، اسان سفارش ڪريون ٿا ته ڪلائنٽ استعمال ڪن IBM i ڊفالٽ پروسيسر ملٽي ٽاسڪنگ سيٽنگون، جيڪي SMT کي وڌ کان وڌ ڪنديون.
LPAR جي ترتيب لاءِ سطح.
ورهاڱي جي جڳهه
موجوده FW سطحن کي يقيني بڻائي ٿو ته پارٽيشنن جي بهترين جاءِ تي. تنهن هوندي، جيڪڏهن بار بار DLPAR آپريشن سي اي سي تي ورهاڱي تي عمل ڪيو وڃي، ان کي استعمال ڪرڻ جي سفارش ڪئي وئي آهي DPO
جڳهه کي بهتر ڪرڻ لاء.
ورچوئل پروسيسرز - حصيداري بمقابله وقف پروسيسرز
بهترين ورهاڱي جي سطح جي ڪارڪردگي لاء وقف پروسيسر استعمال ڪريو.
توانائي اسڪيل
بهترين سي پي يو پروسيسر جي رفتار لاءِ، پڪ ڪريو ته وڌ ۾ وڌ ڪارڪردگي مقرر ڪئي وئي آهي (ڊفالٽ IBM پاور E1080 لاءِ). هي سيٽنگ ASMI ۾ ترتيب ڏنل آهي.
اسٽوريج ۽ نيٽورڪنگ I/O
VIOS لچڪدار اسٽوريج ۽ نيٽ ورڪنگ ڪارڪردگي مهيا ڪري ٿي. بهترين ممڪن ڪارڪردگي لاءِ، I/O لاءِ مقامي IBM i انٽرفيس استعمال ڪريو.
وڌيڪ جامع معلومات
لنڪ ڏانهن رجوع ڪريو: IBM I on Power - Performance FAQ https://www.ibm.com/downloads/cas/QWXA9XKN
انٽرپرائز لينڪس آپريٽنگ سسٽم (OS) توهان جي هائبرڊ ڪلائوڊ انفراسٽرڪچر ۽ اسڪيل اپ انٽرپرائز سافٽ ويئر حلن لاءِ هڪ مضبوط بنياد آهي. تازيون رليزون بهتر ڪيون ويون آهن بهترين-ان-ڪلاس پاور10 انٽرپرائز سسٽم لاءِ
پاور10
- SLES15SP3، RHEL8.4 سپورٽ پاور10 اصلي موڊ
- ڪمپاس موڊ سپورٽ ڪلائنٽ کي پراڻي نسل جي پاور سسٽم مان لڏپلاڻ ڪرڻ جي اجازت ڏيڻ لاءِ (P9 ۽ P8)
- پاور10 موڊ ۾ ڊفالٽ ريڊڪس ترجمي جي حمايت
- انڪرپشن ڪارڪردگي ۾ اهم بهتري
لينڪس + پاور وي ايم
- پاور وي ايم انٽرپرائز خاصيتن لاءِ سپورٽ: LPM، شيئرڊ سي پي يو پول، ڊي ايل پي آر
- جديد حل: SAP HANA مستقبل جي ايپليڪيشن جي ترقي 4PB ورچوئل ايڊريس اسپيس سان
- ڊيٽا کي ٻيهر لوڊ ڪرڻ لاءِ وقت گھٽايو: SAP HANA لاءِ ورچوئل PMEM سپورٽ
- عالمي-طبقاتي حمايت ۽ خدمت
حمايت ٿيل ڊسڪشن:
- پاور 9 سان شروع ڪندي صرف RedHat ۽ SUSE پاور وي ايم پارٽيشنن ۾ سپورٽ آھن
- ڊسٽرو سپورٽ ميٽرڪس تي تفصيلي ڄاڻ پراڻي نسل HW کي ڍڪيندي
LPM سپورٽ:
- لينڪس منطقي ورهاڱي کي پراڻي نسل جي پاور سسٽم مان منتقل ڪريو ويجھو صفر ايپليڪيشن ڊائون ٽائم سان
- حوالو: LPM گائيڊ ۽ لاڳاپيل معلومات
پاور مخصوص پيڪيجز:
- PowerPC-utils پيڪيج: IBM PowerPC LPARs جي سار سنڀال لاءِ افاديت تي مشتمل آھي. distro جي حصي طور دستياب آهي.
- پاور تي لينڪس لاءِ ايڊوانس ٽول چين: جديد ڪمپليرز تي مشتمل آهي، رن ٽائم لائبريريون.
بهترين طريقا:
- RHEL اڳواٽ طئي ٿيل ٽيوننگ مهيا ڪري ٿي tuned سروس جي حصي طور.
- SAP ايپليڪيشنن لاءِ تجويز ڪيل OS سيٽنگن لاءِ جديد SAP نوٽس جو حوالو ڏيو. عام طور تي tuned RHEL ۾ استعمال ٿيندو آهي ۽ SLES ۾ قبضو يا sapconf
- فريڪئنسي کي PowerVM پاران منظم ڪيو ويندو آهي. حوالو: توانائي جو انتظام
- پاور8 وڏي متحرڪ DMA ونڊو شروع ڪرڻ ۾ مدد ڪري ٿي I/O ڪارڪردگي کي بهتر ڪرڻ.
- Starting Power9 24×7-Monitoring perf ٽول سان ضم ٿيل آهي. سڄي نظام جي نگراني ڪرڻ جي اجازت ڏئي ٿو.
- پڪ ڪريو ته سسٽم فرم ویئر جي سطح موجوده آهي.
- PowerPC-utils مان lparnumascore LPAR جو موجوده لاڳاپو سکور ڏيکاري ٿو. DPO LPAR لاڳاپو سکور کي بهتر ڪرڻ لاء استعمال ڪري سگهجي ٿو.
وڌيڪ پڙهو:
- پاور لاءِ SLES ۽ ڪجهه زبردست خاصيتون.
- شروع ڪريو لينڪس تي پاور سسٽم، لينڪس تي پاور سسٽم سرورز تي
- انٽرنيشنل لينڪس ڪميونٽي
- IBM پاور سسٽم مختلف نيٽ ورڪ اڊاپٽر کي سپورٽ ڪري ٿو مختلف رفتار ۽ بندرگاهن جي تعداد.
- جيڪڏهن توهان ساڳيو نيٽ ورڪ اڊاپٽر استعمال ڪري رهيا آهيو جيئن توهان جي پوئين سسٽم، شروعاتي طور تي، ساڳئي ٽيوننگ نئين سسٽم تي استعمال ٿيڻ گهرجي.
- گھڻا Ethernet اڊاپٽر سپورٽ ڪن ٿا گھڻن وصولن ۽ منتقلي قطارن جي جن جي بفر جي سائيز کي مختلف ٿي سگھي ٿو وڌ ۾ وڌ پيڪٽ جي ڳڻپ کي وڌائڻ لاءِ.
- ڊفالٽ قطار سيٽنگون مختلف اڊاپٽرن سان مختلف آھن ۽ ڪلائنٽ-سرور ماڊل ۾ وڌ ۾ وڌ پيغام جي شرح حاصل ڪرڻ لاءِ بھتر نه ٿي سگھي.
- اضافي قطارون استعمال ڪندي سسٽم جي سي پي يو استعمال کي وڌائيندو؛ تنهنڪري هڪ مخصوص ڪم لوڊ لاءِ بهتر قطار سيٽنگ استعمال ٿيڻ گهرجي.
تيز رفتار اڊاپٽر غور
- 25 GigE ۽ 100 GigE نيٽ ورڪ اڊاپٽرن سان تيز رفتار نيٽ ورڪ ڪيترن ئي متوازي موضوعن ۽ ڊرائيور جي خاصيتن جي ٽيوننگ جي ضرورت آهي.
- جيڪڏهن اهو هڪ Gen4 اڊاپٽر آهي، پڪ ڪريو ته ٺاهيل هڪ Gen4 سلاٽ تي ويٺي آهي.
- اضافي افعال جهڙوڪ کمپريشن، انڪرپشن، ۽ نقل شامل ڪري سگھن ٿا دير سان
AIX ۾ قطار سيٽنگون تبديل ڪرڻ
AIX ۾ وصول ڪرڻ / منتقل ڪرڻ واري قطار جو تعداد تبديل ڪرڻ لاء
- ifconfig enX کي الڳ ڪريو
- chdev -l entX -a queues_rx= -a quees_tx=
- chdev -l enX -a state=up
لينڪس ۾ قطار سيٽنگون تبديل ڪرڻ
لينڪس ethtool ۾ قطارن جو تعداد تبديل ڪرڻ -L ethX گڏيل
AIX ۾ قطار جي سائيز کي تبديل ڪرڻ
- ifconfig enX کي الڳ ڪريو
- chdev -l entX -a rx_max_pkts = -a tx_max_pkts =
- chdev -l enX -a state=up
لينڪس پي ۾ قطار جي سائيز کي تبديل ڪرڻ: ethtool -G ethX rx tx
ورچوئلائيزيشن
- مجازي نيٽ ورڪنگ SRIOV، vNIC، vETH جي صورت ۾ سپورٽ ڪئي وئي آهي. ورچوئلائيزيشن ويڪرائي ۾ اضافو ڪري ٿي ۽ مقامي I/O جي مقابلي ۾ ذريعي گھٽائي سگھي ٿي.
- پسمانده هارڊويئر کان علاوه، پڪ ڪريو ته VIOS ميموري ۽ سي پي يو جي مقدار ڪافي آهن گهربل ذريعي ۽ جوابي وقت مهيا ڪرڻ لاءِ
- IBM PowerVM بهترين طريقا VIOS جي ترتيب ڏيڻ ۾ تمام مددگار ثابت ٿي سگھن ٿا
- جيڪڏهن توهان ساڳيو اسٽوريج ايڊاپٽر استعمال ڪري رهيا آهيو جيئن توهان جي پوئين سسٽم، شروعاتي طور تي، ساڳئي ٽيوننگ نئين سسٽم تي استعمال ٿيڻ گهرجي. جيڪڏهن موجوده سسٽم مان اضافي ڪارڪردگي گهربل آهي، ته پوء عام سرنگ کي انجام ڏيڻ گهرجي.
- جيڪڏهن اسٽوريج سب سسٽم اڳئين سسٽم جي ڀيٽ ۾ نئين سسٽم تي قابل قدر مختلف آهن، غور جي هيٺ ڏنل فهرست ايپليڪيشنن جي سمجھي رفتار تي منفي اثر انداز ڪري سگهي ٿي.
- سڌو منسلڪ اسٽوريج (DAS يا اندروني) کان اسٽوريج ايريا نيٽورڪ (SAN) يا نيٽ ورڪ منسلڪ اسٽوريج (NAS) (يا خارجي اسٽوريج) ۾ تبديلي دير سان وڌائي سگھي ٿي.
- اضافي افعال جهڙوڪ ڪمپريشن، انڪرپشن ۽ ڊيپليٽيشن دير سان شامل ڪري سگھن ٿا.
- اسٽوريج LUNs جو تعداد گھٽائڻ سرور ۾ وسيلن کي گھٽائي سگھي ٿو گھربل throughputs کي سپورٽ ڪرڻ لاءِ.
- انهن اثرن کي سمجهڻ لاءِ نون ڊوائيسز لاءِ ٽيوننگ يا سيٽ اپ گائيڊ ڏسو.
- ورچوئلائيزيشن ويڪرائي ۾ اضافو ڪري ٿي ۽ مقامي I/O جي مقابلي ۾ ذريعي گھٽائي سگھي ٿي. پس منظر هارڊويئر کان علاوه، VIOS ياداشت ۽ سي پي يو کي يقيني بڻائي
- VIOS ۾ تيز رفتار ورچوئلائيز ايڊاپٽرز ڏانھن منتقل ڪرڻ لاءِ سي پي يوز ۽ ميموري ۾ VIOS ترتيبن کي ترتيب ڏيڻ جي ضرورت پوندي. IBM PowerVM بهترين طريقا VIOS جي ترتيب ڏيڻ ۾ تمام مددگار ثابت ٿي سگھن ٿا.
ترتيب ڏيڻ جي هدايتون - مھرباني ڪري ڏسو IBM علم مرڪز AIX ۽ Linux ھدايتن لاءِ.
PCIe3 12 GB ڪيش RAID + SAS اڊاپٽر Quad-port 6 Gb x8 Adapter Linux:
- https://www.ibm.com/docs/en/power9/9223-42H?topic=availability-ha-asymmetricaccess-optimization
- https://www.ibm.com/docs/en/power9/9223-42H?topic=linux-common-sas-raidcontroller-tasks
AIX:
- https://www.ibm.com/docs/en/power9/9223-42H?topic=aix-multi-initiator-highavailability
- https://www.ibm.com/docs/en/power9/9223-42H?topic=aix-common-controller-diskarray-management-tasks
آئي بي ايم
- https://www.ibm.com/docs/en/power9/9223-42H?topic=configurations-dual-storageioa-access-optimization
- https://www.ibm.com/docs/en/power9/9223-42H?topic=i-common-controller-diskarray-management-tasks
PCIe3 x8 2-پورٽ فائبر چينل (32 Gb/s) اڊاپٽر
- https://www.ibm.com/docs/en/aix/7.2?topic=iompio-device-attributes
- https://www.ibm.com/docs/en/power9?topic=channel-npiv-multiple-queue-support
ڪارڪردگي لاءِ اضافي AIX ٽيوننگ:
- SCSI مٿان فائبر چينل (MPIO): هر ڊسڪ لاءِ round_robin تي multipath algorithm مقرر ڪريو
- NVMe مٿان فائبر چينل: سيٽ هر NVMe لاءِ 7 ڏانهن منسوب ڪري سگھي ٿو فائبر چينل تي متحرڪ ڪنٽرولر دريافت جي مرحلي دوران ٺاهيل
ڪارڪردگي لاءِ NVMe اڊاپٽر AIX ٽيوننگ
سيٽ هر NVMe ڊوائيس لاء 8 ڏانهن منسوب ڪري سگھي ٿو
IBM جا ايندڙ نسل C/C++/Fortran گڏ ڪرڻ وارا جيڪي IBM جي ترقي يافته اصلاحن کي اوپن سورس LLVM انفراسٽرڪچر سان گڏ ڪن ٿا
![]() |
|
ايل ايل وي ايم C/C++ ٻولي لاءِ وڏي ڪرنسي تيز تعمير جي رفتار ڪميونٽي عام اصلاح مختلف LLVM تي ٻڌل افاديت |
IBM اصلاح پاور فن تعمير جو مڪمل استحصال صنعت جي معروف ترقي يافته اصلاح عالمي-طبقاتي حمايت ۽ خدمت |
دستيابي
- 60-ڏينهن بغير چارج جي آزمائش: اوپن XL پراڊڪٽ صفحي تان ڊائون لوڊ ڪريو
- حاصل ڪريو IBM ورلڊ ڪلاس سروس ۽ سپورٽ لچڪدار لائسنسنگ اختيارن ذريعي، ڊبل پائپ (AAS ۽ PA) کان
- دائمي لائسنس (في بااختيار صارف يا في سمورو استعمال ڪندڙ)
- مهيني لائسنس (في ورچوئل پروسيس ڪور): ٽارگيٽ ڪلائوڊ استعمال ڪيس، مثال طور، پاور وي آر مثال تي
تجويز ڪيل ڪارڪردگي ٽيوننگ جا اختيار
اصلاح جي سطح | استعمال جون سفارشون |
-O2 ۽ -O3 | عام شروعاتي نقطي |
لنڪ وقت جي اصلاح: -flto (C/C++)، -qlto (Fortran) | ڪيترن ئي ننڍن فنڪشن ڪالن سان ڪم لوڊ لاء |
پروfile ھدايت واري اصلاح: -fprofile-پيدا ڪرڻ، -fprofileاستعمال ڪريو (C/C++) -qprofileپيدا ڪرڻ، -قپروfileاستعمال ڪريو (فورٽران) |
گھڻي برانچنگ ۽ فنڪشن ڪالن سان ڪم لوڊ لاء |
وڌيڪ معلومات لاء مهرباني ڪري دورو ڪريو: https://www.ibm.com/docs/en/openxl-c-and-cpp-aix/17.1.0
https://www.ibm.com/docs/en/openxl-fortran-aix/17.1.0
اوپن XL 10 سان مڪمل پاور17.1.0 آرڪيٽيڪچر استحصال
- نئون ڪمپلر آپشن '–mcpu=pwr10' ڪوڊ ٺاهڻ لاءِ پاور10 هدايتون جو استحصال ڪندي ۽ خود بخود پاور10 لاءِ اصلاحن کي ٽيون ڪري ٿو
- نئين پاور10 فنڪشنلٽيز کي ان لاڪ ڪرڻ لاءِ نئون بلٽ ان فنڪشن، مثال طور، ميٽرڪس ملٽي پلائي ايڪسيليٽر (MMA)
- پاور 10 لاءِ نئون MASS SIMD ۽ ویکٹر لائبريريون شامل ڪيون ويون. سڀ MASS لائبريري افعال (SIMD، vector، scalar) Power10 (پڻ پاور9) لاءِ ترتيب ڏنل.
نوٽ: XL Compilers جي اڳئين ورزن سان گڏ ڪيل ايپليڪيشنون (مثال طور، XL 16.1.0) اڳوڻي پاور پروسيسرز تي هلائڻ لاءِ پاور10 تي مطابقت سان هلنديون.
AIX تي بائنري مطابقت
نوٽ: AIX 16.1.0 لاءِ XL C/C++ اڳ ۾ ئي هڪ نئون انوڪيشن xlclang++ متعارف ڪرايو آهي جيڪو LLVM پروجيڪٽ کان Clang فرنٽ-اينڊ کي استعمال ڪري ٿو ü C++ شيون جيڪي xlC سان ٺهيل آهن
- AIX (IBM جي پنهنجي فرنٽ-اينڊ جي بنياد تي) AIX لاءِ xlclang++ 16.1.0 سان ٺهيل C++ شين سان بائنري مطابقت رکندڙ نه آهن.
- AIX لاءِ xlclang++ 16.1.0 سان ٺهيل C++ شيون نئين Open XL C/C++ AIX 17.1.0 لاءِ بائنري مطابقت رکندڙ هونديون.
- C مطابقت سڀني AIX گڏ ڪرڻ وارن ۾ برقرار رکي ٿي (اڳوڻي XL ورجن AIX لاءِ، اوپن XL C/C++ AIX 17.1.0 لاءِ)
- Fortran مطابقت AIX لاءِ اڳئين XLF ورزن ۽ AIX 17.1.0 لاءِ اوپن XL Fortran جي وچ ۾ برقرار رکي ٿي.
دستيابي
جي سي سي گڏ ڪرڻ وارا سڀئي انٽرپرائز لينڪس ڊسٽريبيوشن ۽ آن تي موجود آهن
AIX.
- انسٽال ٿيل GCC ورزن RHEL 8.4 تي 8 ۽ SLES 7.4 تي 15 آهي. RHEL 9 کي GCC 11.2 موڪلڻ جي اميد آهي.
- GCC جو ڪافي تازو ورزن حاصل ڪرڻ جا ڪيترائي طريقا آھن جڏھن تقسيم لاءِ ڊفالٽ مرتب ڪندڙ پاور10 کي سپورٽ ڪرڻ لاءِ تمام پراڻا آھن.
- Red Hat ھن مقصد لاءِ GCC Toolset [1] کي سپورٽ ڪري ٿو.
- SUSE مهيا ڪري ٿو ڊولپمينٽ ٽولز ماڊل. [2]
- IBM پيش ڪري ٿو جديد مرتب ڪندڙ ۽ لائبريريون ايڊوانس ٽول چين ذريعي. [3]
IBM Advance Toolchain
- Advance Toolchain مهيا ڪري ٿو پاور-آپٽمائزڊ سسٽم لائبريريون گڏ ڪرڻ سان گڏ گڏ ڪرڻ وارا، ڊيبگر، ۽ ٻيا اوزار.
- Advance Toolchain سان بلڊنگ ڪوڊ جديد پروسيسرز تي ممڪن طور تي تمام اعليٰ اصلاحي ڪوڊ پيدا ڪري سگھي ٿو.
ٻوليون
- C (GCC)، C++ (g++)، ۽ Fortran (gfortran)، ٻين سان گڏ جيئن ته Go (GCC)، D (GDC)، ۽ Ada (gnat).
- صرف GCC، g++، ۽ gfortran عام طور تي ڊفالٽ طور نصب ٿيل آهن.
- گولنگ ڪمپلر [4] پاور تي گو پروگرام ٺاهڻ لاءِ ترجيحي متبادل آهي.
پاور10 تي مطابقت ۽ نيون خاصيتون
- POWER8 يا POWER9 پروسيسرز تي هلائڻ لاءِ GCC جي اڳوڻي ورزن سان گڏ ڪيل ايپليڪيشنون پاور10 پروسيسرز تي مطابقت سان هلنديون.
- GCC 11.2 يا بعد ۾ سفارش ڪئي وئي آهي ته پاور ISA 3.1 ۾ موجود سڀني نئين خاصيتن کي استعمال ڪرڻ ۽ پاور 10 پروسيسرز ۾ لاڳو ڪيل.
- GCC 11.2 پاور10 پروسيسرز پاران مهيا ڪيل ميٽرڪس ملٽي پلائي اسسٽ (MMA) خاصيت تائين رسائي فراهم ڪري ٿي. [5]
- MMA پروگرام ڪنهن به GCC، LLVM، ۽ Open XL ڪمپيلرز کي استعمال ڪندي مرتب ڪري سگھجن ٿا، بشرطيڪ توهان ڪافي تازو رليز استعمال ڪريو.
IBM تجويز ڪيل ۽ سپورٽ ڪيل ڪمپلر پرچم [6]
-O3 يا -اوڀر | جارحتي اصلاح. -اوڀر بنيادي طور تي -O3 -فاسٽ-رياضي جي برابر آهي، جيڪو پڻ IEEE سچل پوائنٽ رياضي تي پابنديون آرام ڪري ٿو. |
-mcpu = پاور | پاور پروسيسر پاران سپورٽ ڪيل هدايتون استعمال ڪندي گڏ ڪريو. مثال طورampلي، صرف پاور 10 تي دستياب هدايتون استعمال ڪرڻ لاء، چونڊيو -mcpu=power10. |
-جي طرف | اختياري. انجام ڏيو "لنڪ-وقت" اصلاح. هي ڪوڊ کي بهتر ڪري ٿو فنکشن ڪالن ۾ جتي ڪالر ۽ سڏايل فنڪشن موجود آهن مختلف تاليف يونٽن ۾، ۽ اڪثر ڪري سگھن ٿا هڪ اهم ڪارڪردگي واڌارو. |
-انروول- لوپس | اختياري. لوپ باڊيز جي وڌيڪ جارحيت واري نقل کي انجام ڏيو عام طور تي ڪمپيلر جي ڀيٽ ۾. عام طور تي، توهان کي هن کي ڇڏڻ گهرجي، پر ڪجهه ڪوڊس تي، اهو بهتر ڪارڪردگي مهيا ڪري سگهي ٿو. |
نوٽ:
جيتوڻيڪ -mcpu=power10 GCC 10.3 جي شروعاتي طور تي سپورٽ ڪئي وئي آهي، GCC 11.2 کي ترجيح ڏني وئي آهي ڇاڪاڻ ته اڳوڻو مرتب ڪندڙ پاور 10 پروسيسرز ۾ لاڳو ڪيل هر خصوصيت جي حمايت نه ڪندا آهن. ان سان گڏ، -mcpu=power10 استعمال ڪندي ٺاهيل شيون POWER9 يا اڳوڻي پروسيسرز تي نه هلنديون! بهرحال، ڪوڊ ٺاهڻ جا طريقا آهن جيڪي مختلف پروسيسر ورزن لاءِ بهتر ڪيل آهن. [7] [1] ريڊ هٽ: GCC ٽول سيٽ استعمال ڪندي. https://access.redhat.com/documentation/enus/red_hat_enterprise_linux/8/html/developing_c_and_cpp_applications_in_rhel_8/gcc-toolset_toolsets.
[2] SUSE: سمجھڻ جي ترقي جا اوزار ماڊل. https://www.suse.com/c/suse-linux-essentialswhere-are-the-compilers-understanding-the-development-tools-module/.
[3] IBM پاور سسٽم تي لينڪس لاءِ ايڊوانس ٽول چين. https://www.ibm.com/support/pages/advancetoolchain-linux-power.
[4] گو ٻولي. https://golang.org. [5] Matrix-Multiply Assist Best Practices Guide. http://www.redbooks.ibm.com/redpapers/pdfs/redp5612.pdf
[6] GNU ڪمپائلر ڪليڪشن استعمال ڪندي. https://gcc.gnu.org/onlinedocs/gcc.pdf
[7] ھدف-مخصوص اصلاح GNUIindirect فنڪشن ميڪانيزم سان. https://developer.ibm.com/tutorials/optimized-libraries-for-linux-on-power/#target-specific-optimization-
© 2021 IBM Corporation with-the-gnu-Indirect-function-mechanism.
جاوا ايپليڪيشنون بغير ڪنهن به قسم جي صلاحون وٺي سگهن ٿيونtagP10 موڊ ۾ هلندڙ آپريٽنگ سسٽم تي نئين P10 ISA فيچرز جاوا رن ٽائم ورجن استعمال ڪندي هيٺ ڏنل يا نئون:
جاوا 8
- IBM SDK 8 SR6 FP36
- IBM Semeru Runtime Open Edition 8u302: openj9-0.27.1
جاوا 11
- IBM Semeru Runtime Certified Edition 11.0.12.1: openj9-0.27.1
- IBM Semeru رن ٽائم اوپن ايڊيشن 11.0.12.1: openj9-0.27.1
جاوا 17 (ڊرائيور اڃا دستياب نه هوندا)
- IBM Semeru Runtime Certified Edition 17: openj9-0.28
- IBM Semeru رن ٽائم اوپن ايڊيشن 17: openj9-0.28
- OpenJDK 17
ڪارڪردگي جي ترتيب جا حوالا:
آئي بي ايم WebSphere Application Server Performance Cookbook
صفحي جي ماپ
AIX تي اڪثر Oracle ڊيٽابيس لاءِ عام سفارش 64KB صفحي جي سائيز کي استعمال ڪرڻ آهي ۽ SGA لاءِ 16MB صفحي جي سائيز نه. عام طور تي، 64 KB صفحا لڳ ڀڳ ساڳيا حاصل ڪن ٿا
ڪارڪردگي جو فائدو 16 MB صفحا بغير خاص انتظام جي.
TNS ٻڌندڙ
Oracle 12.1 ڊيٽابيس ۽ بعد ۾ رليز ڊفالٽ طور 64k صفحا استعمال ڪندو ٽيڪسٽ، ڊيٽا ۽ اسٽيڪ لاءِ. بهرحال، TNSLISTENER لاءِ اهو اڃا تائين 4k صفحا استعمال ڪري ٿو متن، ڊيٽا، ۽ اسٽيڪ لاءِ. جي طرف
64k صفحن کي فعال ڪريو ٻڌندڙن لاءِ ايڪسپورٽ ڪمانڊ استعمال ڪندي ٻڌندڙ عمل کي شروع ڪرڻ کان اڳ. نوٽ ڪريو ته اي ايس ايم جي بنياد تي ماحول ۾ ڊوڙندو آهي جيڪو ٻڌندڙ کان ٻاهر هلندو آهي
GRID_HOME ۽ نه ORACLE_HOME.
دستاويز "سخت طور تي setenv" حڪم لاء 12.1 يا بعد ۾ رليز ۾ تبديل ٿي وئي. -t يا -T کي -env يا -envs جي حق ۾ هٽايو ويو. Oracle Listener ماحول ۾ سيٽ ۽ برآمد ڪريو:
- LDR_CNTRL=DATAPSIZE=64K@TEXTPSIZE=64K@STACKPSIZE=64K - VMM_CNTRL=vmm_fork_policy=COR (شامل ڪريو 'ڪاپي آن ريڊ' ڪمانڊ)
گڏيل نحو
LDR_CNTRL=SHARED_SYMTAB=Y سيٽنگ کي خاص طور تي 11.2.0.4 يا بعد ۾ رليز ڪرڻ جي ضرورت ناهي. مرتب ڪندڙ لنڪر جا اختيار هن سيٽنگ جو خيال رکندا آهن ۽ هاڻي خاص طور تي سيٽ ڪرڻ جي ضرورت ناهي. اهو سفارش نه آهي ته LDR_CNTRL=SHARED_SYMTAB=Y خاص طور تي 12c يا بعد ۾ رليز ۾ سيٽ ڪيو وڃي.
ورچوئل پروسيسر فولڊنگ
هي هڪ RAC ماحول ۾ هڪ نازڪ سيٽنگ آهي جڏهن LPARs استعمال ڪندي پروسيسر فولڊنگ کي فعال ڪيو ويو آهي. جيڪڏهن هن سيٽنگ کي ترتيب نه ڏني وئي آهي، اتي RAC نوڊ جي خارج ٿيڻ جو هڪ اعلي خطرو آهي روشني ڊيٽابيس ڪم لوڊ جي حالتن هيٺ. شيڊا -p -o vpm_xvcpus = 2
VIOS ۽ RAC ڪنيڪٽ
هڪ وقف ڪيل 10G (يعني 10G Ethernet اڊاپٽر) ڪنيڪشن گهٽ ۾ گهٽ سفارش ڪئي وئي آهي ته جيئن ڪلسٽر ٽائمنگ حساس ٽرئفڪ لاءِ ڪافي بينڊوڊٿ مهيا ڪري. RAC ڪلستر ٽريفڪ - هڪ ٻئي سان ڳنڍڻ واري ٽرئفڪ کي وقف ڪيو وڃي ۽ حصيداري نه ڪيو وڃي. ڪنيڪٽ جي حصيداري ڪري سگھي ٿي وقت جي تاخير جو سبب بنجي ٿو نوڊ ھنگ / بي دخلي مسئلن.
نيٽ ورڪ ڪارڪردگي
هي AIX تي Oracle لاءِ هڪ ڊگھي عرصي کان نيٽ ورڪ-ٽيوننگ تجويز آهي، جيتوڻيڪ ڊفالٽ 0 تي رهي ٿو. rfc1323=1 جي TCP سيٽنگ
وڌيڪ جامع معلومات
لنڪ ڏانهن رجوع ڪريو: پاور سسٽم تي AIX هلائيندڙ موجوده Oracle ڊيٽابيس ورزن جي استحڪام ۽ ڪارڪردگي کي منظم ڪرڻ سميت POWER9
https://www.ibm.com/support/pages/node/6355543
جنرل
- SMT8 موڊ استعمال ڪريو
- وقف ٿيل CPU LPARs استعمال ڪريو
Db2 گودام
- پڪ ڪريو ته هڪ تيز رفتار نجي نيٽ ورڪ سڀني نوڊس جي وچ ۾ موجود آهي
- MLN ترتيب کي محدود ڪريو ھڪڙي نوڊ في ساکٽ تائين
سي پي 4 ڊي
- OCP نوڊس نيٽ ورڪ لاءِ PCIe4 استعمال ڪريو
- OCP 4.8 کان اڳ، ڪرنل پيٽرولر مقرر ڪريو slub_max_order=0
Db2 بهترين طريقا
https://www.ibm.com/docs/en/db2/11.5?topic=overviews-db2-best-practices
نيٽ ورڪ
- پوڊ نيٽ ورڪ لاءِ، مقامي SRIOV جي بنياد تي پرائيويٽ نيٽ ورڪ استعمال ڪريو جيڪڏھن LPM گھربل نه آھي، ٻي صورت ۾، VNIC استعمال ڪريو
- ايپليڪيشنن لاءِ جن کي اعليٰ بينڊوڊٿ يا گھٽ ويڪرائي جي ضرورت آهي، غور ڪريو SR-IOV نيٽ ورڪ آپريٽر استعمال ڪرڻ لاءِ VF سڌو سنئون پوڊ تي تفويض ڪرڻ لاءِ
- گھٽ وقت ختم ٿيڻ جي ضرورت ۾ خدمتن لاءِ، موجوده روٽ لاءِ ڊفالٽ ٽائيم آئوٽ ترتيب ڏيو
- OCP جي ڪلستر نيٽ ورڪ جي گهربل MTU سائيز کي ترتيب ڏيو
آپريٽنگ سسٽم
- CoreOS پوسٽ-انسٽال تبديلين جي اندر u- حدن کي وڌائڻ تي غور ڪريو
- پاور تي پاور پليٽ فارم OCP4.8 تنصيب لاءِ گھٽ ۾ گھٽ OCP تنصيب جي ضرورتن جو حوالو ڏيو
مقرري
- جڏهن ايپليڪيشنن کي ترتيب ڏيو، ياد رکو ته هڪ وي سي پي يو هڪ جسماني ڪور جي برابر آهي جڏهن هڪ ئي وقت ملٽي ٿريڊنگ (SMT)، يا هائپر ٿريڊنگ، فعال نه آهي. جڏهن SMT کي فعال ڪيو ويندو آهي، هڪ VCPU هڪ هارڊويئر سلسلي جي برابر آهي.
- مزدورن ۽ ماسٽر نوڊس لاءِ گھٽ ۾ گھٽ سائزنگ جي ھدايتن جو حوالو ڏيو گھٽ ۾ گھٽ وسيلن جي گھرج
- تعمير ٿيل ڪنٽينر تصويري رجسٽري لاءِ الڳ وقف ٿيل اسٽوريج مختص ڪريو
- او سي پي جي مکيه ڊائريڪٽرن جي مکيه ڊائريڪٽرن لاءِ هيٺيون ترتيب ڏيڻ واريون هدايتون استعمال ڪريو جيڪي OpenShift ڪنٽينر پليٽ فارم جا حصا ڊيٽا لکن ٿيون.
دستاويز / وسيلا
![]() |
IBM پاور 10 ڪارڪردگي [pdf] استعمال ڪندڙ ھدايت پاور10، ڪارڪردگي، پاور10 ڪارڪردگي |