Hvorfor IBM ser OpenCAPI og OMI som fremtiden for akseleratordrevet databehandling

Hvorfor OpenPOWERs royaltyfrie ISA er innstilt på å transformere bedriftsberegning Nå kan POWER ISA integreres, royaltyfritt, noe som gjør arkitekturen til et høyytelsesmotstykke til RISC-V. IBM publiserer referanseimplementeringer for å hjelpe selskaper i gang.

Den forestående slutten av Moore's Law - doblingen av transistorer i integrerte kretsløp omtrent annethvert år - tvinger store filosofiske endringer i hvordan datamaskiner er arkitekturert. Økende klokkehastighet for å øke ytelsen førte til redusert avkastning for 15 år siden, da termiske begrensninger forhindret CPUer fra å meningsfullt overskride 4 GHz i lengre perioder. For å dempe dette har økende kjernetall og trinnvise mikroarkitektoniske forbedringer drevet ytelsesforbedringer siden den gang, selv om denne strategien, på samme måte, mister effektiviteten.

På jakt etter høyere ytelse har adopsjonen av GPU-er for generelle beregningsoppgaver (ellers kjent som GPGPU) økt betydelig for kunstig intelligens (AI) og arbeidsmengder for maskinlæring. Imidlertid er bruk av GPU bare ett aspekt - bruk av beregne akseleratorer, for eksempel smarte NIC-er, applikasjonsorienterte FPGA-er, og forskjellige lag av hukommelse inkludert lagringsklasse minne (SCM) er nødvendig for å få ytelsesforbedringer i en post-Moore's Law miljø.

De etiske utfordringene ved AI: En leders guide (gratis PDF)

Hvordan disse akseleratorene kobles til systemer er et betydelig problem - mens POWER9 bruker den relativt raske PCI Express 4.0-standarden og DDR4, er dette (relativt) dø-sultne forbindelser. Open Coherent Accelerator Processor Interface (OpenCAPI) og Open Memory Interface (OMI) gir en teknologi-agnostisk og lav-latens måte å koble gasspedaler og minne til en CPU.

Som en del av IBMs åpne sourcing av POWER ISA denne uken ble referanseimplementeringer av (nominelt) plattform-agnostiske OpenCAPI og OMI også publisert, noe som ga et asymmetrisk, lite latens og høy båndbredde for å koble sammen akseleratorer og forskjellige typer RAM, gir mulighet for uavhengig utvikling av gassartsteknologi, som har en raskere utviklingssyklus enn den årelange prosessen for påfølgende generasjoner av ISA.

Tidligere denne måneden kunngjorde Microsemi SMC 1000 8x25G, en åttefelts OMI-tilkoblet kontroller som kobles opp til DDR4-3200-hastigheter, på en 84-pinners differensial DIMM (DDIMM). Sammenlignet med direkte festet minne, pådrar OMI-minnet bare en 5-10n belastningsbruddstraff, hvor OMI krever en sjettedel av matrisen som direkte tilkoblet DDR. "Resultatet er en betydelig reduksjon i det nødvendige antall verts-CPU- eller SoC-pinner per DDR4-minnekanal, noe som åpner for flere minnekanaler og øker tilgjengelig minnebåndbredde, " hevdet Microsemi i en pressemelding.

"Dette hender å være et DDR4-produkt, men det kan slås ut med hva som helst, PRAM, GDDR, you name it, " sa Mendy Furmanek, president for OpenPOWER Foundation, til TechRepublic.
"Vi har snakket med en rekke minneselskaper som er ganske lokkede, og spesielt for å hente RTL-en vår som kan få dem i gang."

På samme måte gjør fordelene for andre typer gasspedaler det lettere for utviklere å bygge sine egne tilpassede løsninger.

"Selskaper ønsker å se åpne modeller fra topp til bunn slik at de kan - mens de bygger tilpassede applikasjoner - akselerere dem helt ned til silisiumet. Å være i stand til ... å jobbe i hvert lag i bunken, er noe som gjør at de bare kan lage mye bedre løsninger for seg selv, "sa Jim Zemlin, administrerende direktør i Linux Foundation, til TechRepublic. "Kunder kan gjøre prototyping, eller jobbe med denne åpne koden, men deretter gå til noen som kan tilby kommersiell støtte og bringe en implementering hjem ... som har vist seg å være den moderne måten sluttbrukere ønsker å kjøpe og bygge teknologi på."

"Dette er oppfyllelsen av min personlige drøm, å ha prosjekter i hvert eneste lag av stabelen, men jeg tror det er akkurat der industrien skal, " la Zemlin til.

For mer, se "Raptor's Talos II Lite bringer POWER9 til skrivebordet uten å bryte banken" og "AMDs 16-kjerne Ryzen 9 3950X treffer 4, 7 GHz i turbo på bare 105 W TDP."

Avsløring: James Sanders er assosiert medlem av OpenPOWER Foundation.

Dagens nyeste nyhetsbrev

Hvis du bare kan lese en teknisk historie om dagen, er dette det. Leveres hverdager

Registrer deg i dag

© Copyright 2020 | mobilegn.com