A PLUG-INEK, THUNDERBOLT, VASAK, JÖVŐ

DragonTamás · April 22, 2011

Nemcsak hangzás terén, hanem mondjuk prociterhelések, ilyesmi...

A prociterhelés ki fog derülni, amint kinnt lesznek a pluginek uad-ra. Megnézzük, hogy a kártyákon mennyi fut, meg hogy natívban mennyi. Én is kíváncsi vagyok.

oldbrian · April 22, 2011

én erről azt gondolom, hogy ha próbáltad már a brainworx plugineket, akkor nem fogod csodálni, hogy az UAD felkérte (vagy engedte) őket külső fejlesztőnek. Jó ízléssel (füllel) összerakott algoritmusok, amikben ki tudja mekkora potenciál van, ha nem kell CPUn futtatni őket, annak minden pontatlansági/kiszámíthatatlansági tényezőjére lebutítva.

az ilyeneket nem tudom honnan szeditek, de sajnos nem először hangzott el ebben a topicban, ami elég megdöbbentő. ahogy Tamás is mondja a CPU nem egyszer így, egyszer úgy számol, egy determinisztikus gépről van szó - egy számolás eredménye bizony ugyanaz lesz szombaton és vasárnap is, egy program ugyanúgy fut hétfőn mint szerdán. szerk.: pedig visszaolvasva ezt te is tudhatod nagyon jól. lehet csak félreértem mit akartál azzal a mondattal.

Isten Nyila · April 23, 2011

Miután most friss szemmel újra végigfutottam a tegnapi posztokat, látom, hogy elkezdődött itt egy félreértés, aminek a továbbgyűrűzését jó lesz idejében megakadályozni. Szó nincs semmiféle "számítási pontatlanságról". (Legalábbis, magam részéről én mindvégig a programfutás folyamatát vázoltam.) Egy minden tekintetben előre tervezhető lefutású kódot sokkal könnyebb lehet hatékonyra, takarékosra és kis fogyasztásúra optimalizálni. Ennyi - nincsen benne semmi földönkívüli. A számítási eredmények ettől persze nyilván ugyanazok maradnak; a két dolognak semmi köze nincsen egymáshoz.

Isten Nyila · April 23, 2011

Hozzátennék annyit, hogy azért ez nem zárja ki teljesen, hogy adott esetben egy plugin más-más legyen egy-egy platformon. Nem zárja ki, csak éppenséggel nem ezen múlik, hanem más tényezőkön, például:

Nem biztos, hogy teljesen ugyanazt az algoritmust implementálták a szoftver összes verziójában (ezt közvetve befolyásolhatja az optimalizáció). Továbbá, szintén nem biztos, hogy ezen kívül végzett minden egyéb beavatkozás is azonos (upsampling, oversampling, dithering, és társaik).

silk · April 23, 2011

Igen...a CPU egy teljesen kiszámitható struktúra. Az oprendszer viszont már nem. Gondolom ebben egyetértünk mindahányan.

Az amit IstenNyila írt világítja meg legjobban a különbségek miben létét. Mert lehet, hogy egy matematika eljárásnál (ahol a végrehajtási idö, mint tényezö sarkalatos), bizonyos lépeseket másként oldanak meg a különbözö hardvereken. Ott van az FFT-s példa az egyik posztomban feljebb. Látható, hogy az i7-en nem valami hatékony az eljárás, tehát vagy beáldozom a teljesitményt, vagy keresek egy "közelitö" megoldást, ami bizonyos tartományon belül (mondjuk 5 tizedesjegyig) megfelelö eredményt ad. Maga az "elméleti furmula" az "algoritmus" ugyanaz marad, csak egy két lépésben "egyszerüsitek" a kódolásnál, hogy elég gyors legyen a program.

Mikor én írtam pont az i7 "pontatlanságáról", akkor ilyesmire gondoltam, nem pedig arra, hogy 2+2 az 4.00009 mondjuk az intelnél.

oldbrian · April 25, 2011

semmilyen paramétert nem adtál meg a használt FFT-ről: tényleges multiprocesszoros volt-e a CPU algoritmus, használt-e CPU-s vektoros utasításkészletet (SSE pl., de a 2-es már rég volt) stb. az alapján amit te leírtál annyi látszik jelenleg, hogy ötször gyorsabb az i7. mégis mit akarsz ezzel alátámasztani?

szerk.: az egyértelműség kedvéért a papíron lévő teljesítménykülönbség nyilván nem vehető szó szerint, az, hogy csak 5x és nem 37x olyan gyors egy rövid FFT-nél nem nagy szó. a GPU-kra írt GFLOPS és TFLOPS teljesítmények is csak speciális feladatoknál érhetőek el, ez csak marketing.

cshuszar · April 26, 2011

Én kérek elnézést a pongyola megfogalmazásért, és az ebből fakadó félreértésekért.

"ha nem kell CPUn futtatni őket, annak minden pontatlansági/kiszámíthatatlansági tényezőjére lebutítva."

nyilván egy CPU a 2x2-re ugyanazt az eredményt dobja, mint bármi más xPU. A pontatlanságot és kiszámíthatatlanságot csakis az időzítésekre, és az eredmény "megérkezésének" időpontjára értettem, és így utólag visszaolvasva, amit leírtam eredetileg valóban nem ezt jelenti.

comp · April 27, 2011

A legszűkebb keresztmetszet az adott implementáció válaszideje (ugyebár senki se szereti lassan lerenderelni az anyagot amin épp dolgozik minden egyes módosítás után) - habár az algoritmusok lehetővé teszik hogy nagyobb felbontásban is lehessen őket használni, jórészt ésszerű határokon belül kell tartani őket.

Ha már az i7-ről esett szó: a technológia az alapvető komponensek szempontjából a régi PIII-as architektúrának felel meg (ami látszólag visszalépés), a különbség a külső egységek összekötési módjában (QPI) és az integrált memóriavezérlőben van. Az FPU terén semmi komolyabb előrelépés nem történt (az SSE 4.2 is csak 7 új utasítást tartalmaz). Ami általános CPU-használat esetében előnyt jelent (nevezetesen a háromszintű cache) - mivel az L3 cache nem a processzor órajelével azonos sebességen megy - komoly hátrányt jelent az előre tervezhető válaszidő tekintetében, ha mint masszív processzáló egységként szerenténk használni (a válaszidő a cache "törése" miatt nem lesz konstans érték).

silk · April 27, 2011

Még egyszer rá szeretnék világitani egy fontos aspektusára ennek a dolognak, mielött újra belemerülünk a dsp vs cpu háborúba.

Ne csak azt vegyük figyelembe, hogy melyik platform "papiron" mit tud, hanem azt is hogyan. Hogyan közelithetö meg az adott valós probléma az adott eszközön, hol vannak a "hibák", hogyan lehet ezeket minimalizálni. Jövök egy jó "silkes" példával rögtön...

Van egy barátnöd, aki mindennap felmegy hozzád pár órára. Világos, hogy elég, ha a koszos zoknikat gyorsan eldugod a szekrény aljára, a mostalan poharak a mosogató alatti kis szekrényben landolnak. Máris tök rend a kecóban, s szó se éri a ház elejét soha.

Aztán beköltözik a Drága. Na...akkor már tuti nem lesz elég, az elöbbi metódus, habár tulképpen a napi találkozás szintetek szinte semmivel se növekszik, azaz csak pár "közös óra" van igazán, tehát a lényeg ugyanaz...Viszont sokkal "keményebbek" az elvárások a zoknikkal szemben.

Ilyesmi ez a galád algoritmus háború is. Mert lehet, ugyanaz az elv mindkét platformon, az eredmény nem bizti, hogy ugyanazt hozza. Egy DSP-t sokkal "körülményesebb" programozgatni, mint egy CPU-t. Viszont a "spártai" rendszernek megvan az az elönye, hogy minden részletet ki kell dolgozni, nem maradhat "elvarratlan" szál. Az algoritmust sokkal "keményebb" elvárásokkal szempben kell sokkal precizebben implementálni programozás szinten. Elég, ha mondjuk csak egy sima 32bit float/24 bit fix konverziót veszünk. I7-en lesz egy csomó library C-ben, ami ezt csinálja, meghívod és kész, minek programoznád újra, mikor ott van készen 1000 (persze fingod sincs a buktatóiról). Egy DSP-n "kénytelen" vagy csinálni egyet magadnak, de arról legelább "pontosan" fogod tudni, mit cseszik el, s hol hibázik (vagy használod valamelyik library-t, viszont általában ott pontosan definiált a hiba tényezö). Persze "okos" programozó nem esik ilyen hibákba ugye...tehát "elvileg", megfelelö "odafigyeléssel" szerintem BÁRMELYIK platformon lehet jó dolgot csinálni. Tehát inkább az "emberi" tényezö az, amit itt föleg számit, s tök mindegy, hogy SHARC, Texas, Motorola, I7, i15, z876 vagy hte85892210. Max teljesitményben lesznek kisebb nagyobb különbségek, elvileg a 2+2 az mindenütt 4.

GálosiLászló · April 28, 2011

Jövök egy jó "silkes" példával rögtön...
Van egy barátnöd...

Jézus ereje...:DDD

oldbrian · April 28, 2011

DSP-re is vannak ugyanúgy fejlesztői tool-ok és C könyvtárak, nem kézi munka az egész, nem kell mindent magadnak csinálni (hacsak nem nagyon alacsony költségvetésű fejlesztésben vagy, ahol nincs pénz licenszelni, de jó eséllyel előbb fog kihalni alólad a project ebben az esetben, mint hogy befejezd a saját logaritmus és gyökvonás implementációidat). az emberi tényező mellett a pénz és az idő a nagyon fontos - és hat az elsőre.

oldbrian · April 28, 2011

az SSE 4.2 is csak 7 új utasítást tartalmaz

azért ebben az AVX-nek is van szerepe, azzal együtt nem 7 új utasítás van (már ha ilyen összevetésben is SSE extension-nek vesszük)

silk · April 29, 2011

Az én szempontjaim szerint is elég sokat lépett az Intel az i7-tel elöre hardware szinten. Ahogy feljebb is irtam valahol, nagyban feltuningolták az FPU teljesitményt, egy csomó uj implementációval, ami ha nem is a jövöbe mutat, de mindenképp naprakész és versenyképes sok szegmensben, amiben eddig az intel labdába se rúgott. Az, hogy ezt a mérnökök miképpen aknázzák ki, s kiaknázzák-e egyátalán, már egy más lapra tartozik. Intel nálam legalábbis kapott egy piros pontot az i7-re.

Isten Nyila · May 1, 2011

TC plugineket tervezik-e portolni az UAD-ra vagy bárhova?

Régebben még nem terveztek ilyesmit... De vajon ez ezután is így marad?

http://tcsupport.custhelp.com/cgi-bin/tcsupport.cfg/php/enduser/std_adp.php?p_faqid=780&p_created=1023864533

Bejelentkezés

A PLUG-INEK, THUNDERBOLT, VASAK, JÖVŐ

Recommended Posts

Link to comment

Share on other sites

Link to comment

Share on other sites

Link to comment

Share on other sites

Link to comment

Share on other sites

Link to comment

Share on other sites

Link to comment

Share on other sites

Link to comment

Share on other sites

Link to comment

Share on other sites

Link to comment

Share on other sites

Link to comment

Share on other sites

Link to comment

Share on other sites

Link to comment

Share on other sites

Link to comment

Share on other sites

Link to comment

Share on other sites

Archived