Сучасна диджитал-освіта для дітей — безоплатне заняття в GoITeens ×
Mazda CX 5
×

Процессоры

Ищу единомышленников. Идея проста. Разработать до уровня патента процессор обработки изображений. You need Altera Quartus software to compile your own projects.Денег нет. Кто хочет поиздеваться над дураками, издевайтесь по делу, экономьте своё и наше время.

👍ПодобаєтьсяСподобалось0
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Ищу единомышленников. Идея проста. Построить небоскреб в 1000 этажей (я пока еще не знаю будет ли он многоэтажный или может 1000 одноэтажных коттеджей, а может это будет подземный торговый центр и 1000 этажей идут в глубину). Денег нет. Тут на одном форуме мне сказали, что дома строют из кирпичей, поэтому вы должны уметь класть кирпичи. Сам я занимаюсь выращиванием плодово-ягодных культур, но у меня оч. много классных идей по поводу строительства небоскребов. Готов начинать закладывать фундамент нового дома уже завтра (на одном форуме сказали, что кирпичи ТМ «Кирпич-индастриз» для этого подойдут).

на любой этаж ведёт всего один лестничный пролёт.

Толстота в адрес квантовых компьютеров? )

нет, у топикстартера изображение обрабатывается за один такт

для квантового было бы «поднявшись всего на один пролёт можно оказаться на любом этаже. правда нельзя предсказать на каком именнно..»

В квантовом доме лестницы ненужны. В квантовом доме пользователь находится на всех этажах одновременно.

Странно, по профилю вроде разработчик, а мыслите как директор ...

директор бы поподробнее описал главный вход и во что будет одет портье.

Зайдем с другого конца.

You need Altera Quartus software to compile your own projects.
Сколько вентилей максимум реализует в одном чипе Altera?
Сколько вентилей нужно на одну элементарную графическую операцию на один пиксел?
Далее.
4К изображение содержит почти 13млн. пикселей.
Для обработки в духе «одна операция над кадром за такт» Вам необходимо обеспечить энное число вентилей (блок) на каждый пиксель (даже для 24битного цвета это выливается под 40млн исходных данных) с прямым одновременным доступом. Насколько понял, у альтеры нет такого чипа. Значит придется дробить (то есть грубо говоря — один чип на одну строку 4К изображения, если потянет %) ). Не касаясь физических габаритов такого «процессора» возникают сильные ограничения в спектре графических операций, которые можно реализовать, из-за такого разбития.
Далее — если дробить, то чем это отличается от набора кудовских ядер, которые занимают гораздо меньше места, имеют хорошую поддержку (как аппаратную, так и программную) и намного более гибче «хардкорного процессора»? К тому же куда поддерживает кластеризацию. Titan GTX Z — 5760 ядер. К тому времени, когда Вы сможете представить более-менее работающий прототип в разрешении хотя бы VGA с набором простейших операций (что никому не нужно) — будут чипы с десятками тысяч ядер (если надо будет), спокойно проглатывающие тяжелые операции 4К на 200Гц в реальном времени.

То есть главный вопрос — зачем то, что Вы собираетесь, нужно?
То есть для кого, для каких задач?
Тут много раз задавали Вам этот вопрос — но ответа я так и не увидел.
Тогда и будет понятно.
А так будут троллить по полной ибо получается разговор в духе «купи слона».

А не скажу бесплатно. А кстати, у них же помещается всё громадьё?

Ну тогда остается только троллить %)

А кстати, у них же помещается всё громадьё?
Хм.
Altera Cyclon V — 301K LEs. Если даже зашить 1 операцию, каждую из которых реализовать хотя бы 10LE, то получим 30К точек (173×173) для однобитового изображения.
Или я неправильно понимаю что-то?
ПС: не троллю, пытаюсь понять, так как с плисами, конечными автоматами сталкивался лет этак.... 20 назад. Может чего в мире и поменялось за это время в этой сфере.

Если уже сейчас задумка настолько такой секрет что приводит к «не скажу бесплатно» то к сожалению присоединюсь к тем, кто говорит «у вас ничего не получится».
Можно вспомнить «выстрелившие» проекты типа prom.ua, авторы на любом этапе работ могли рассказывать что они делают и это работало только как пиар в их пользу. Если у вас иначе — вероятнее всего вы плохо искали аналоги, которые уже реализованы.
Т.е. если работы реально ведутся, за вами будет не угнаться

А кто вам сказал, что ответ есть ? Если бы он был, зачем сюда писать, надо идти и патентовать

Патентование как цель тоже так себе если что.

Для обработки в духе «одна операция над кадром за такт» Вам необходимо обеспечить энное число вентилей (блок) на каждый пиксель (даже для 24битного цвета это выливается под 40млн исходных данных) с прямым одновременным доступом.
Так не делают уже лет 15 и даже больше, если рассматривать SGI рабочие станции, как точку отсчёта. В железе есть внутреннее представление цветовой компоненты, для раннего железа это 9, 10, 11, 12 бит, для более современного (лет 10-12 — это float point). Это удобно тем, что делается один раз качественный image processor core со всеми необходимыми алогоритмами обработки только для одного формата. Для процессора изображений прикручивают scatter-gather dma с конвертером из машинных данных во внутренний формат и наоборот.

Самая главная проблема, которую ТС никак не хочет признавать — это доставка исходных данных и забор результата. Ведь никому не нужен чёрный ящик без входов и выходов. Чем быстрее будет процессор, тем менее загруженным он будет, а это классический боттлнек фон Неймана.

Так не делают уже лет 15 и даже больше, если рассматривать SGI рабочие станции, как точку отсчёта. В железе есть внутреннее представление цветовой компоненты, для раннего железа это 9, 10, 11, 12 бит, для более современного (лет 10-12 — это float point).
Это не принципиальная разница.
Да, плисов не трогал лет 20. Неужто современные плис умеют работать с float? Тогда это уже не совсем плис в моем понимании...
Я имел в виду вообще теоретическую возможность и физические ограничения того, что задумал автор ТС.
Его идея — это как раз обработка 1 кадра за раз. Именно потому, что сейчас «так никто не делает». А для этого как раз и нужен одновременный доступ/обработка к каждому элементу изображения. Как это изображение туда попадает — на данный момент не суть важно. Может оно там сразу генерируется, а не попадает извне. Я пока что не вижу, как реализовать это выбранными им же средствами для хоть какого-то более менее пристойного размера кадра (от 320×240 для стареньких смартфонов и выше). Я вообще пока не вижу, как можно хотя бы обычный FullHD одним тактом в такой манер реально чем-то обработать.
PS: Пробежался по мануалу VHDL — мир не изменился. Биты, целые и их подмножества/множества. Может плохо смотрел.
PPS: смотрю, а SGI с недавних пор «подсела» на те же «кудовские» карты в реализации Tesla...
Да, плисов не трогал лет 20. Неужто современные плис умеют работать с float? Тогда это уже не совсем плис в моем понимании...
Я видел приличное количество IP core для работы с float, но в рамках плис это скорее всего не тот уровень.
Его идея — это как раз обработка 1 кадра за раз.
Его вторая идея — иметь кучу таких обработчиков, по одному на каждый случай жизни, что вызывает ещё большее недоумение.
Как это изображение туда попадает — на данный момент не суть важно. Может оно там сразу генерируется, а не попадает извне.
Я считаю, что нельзя это рассматривать в отдельности, мы рассматриваем «готовое изделие» в сборе. Даже если предположить, что в плис заливаются все меши, текстуры и прочий стафф и затем оно начинает быстро работать, выполняя каждую операцию за один такт, не требуя входов и выходов, отдавая картинку сразу контроллеру дисплея, то это требует 1) гигантских размеров плис, 2) если не гигантских размеров, то опять же, требуется загрузка и выгрузка данных. Исходя из этих ограничений, идею, какой бы бриллиантовой она не была, рассматривать бессмысленно.
Я считаю, что нельзя это рассматривать в отдельности
Мы просто подходим с разных сторон.
Но вывод у нас один и тот же %)

Уважаемый Михаил! Почему вы не рассматриваете вариант быстрого последовательного сдвигового регистра длинной FullHD для входа и выхода, который работает, к примеру с частотой 10 Ггц. А основная схема работает с частотой 300 МГц. Регистр выполнен по нормам 14 нм, а основная схема — по нормам 100 нм, говорят что это типичная картина для тех же интеловских кристаллов. В результате имеем холодный кристалл.

Вы же понимаете, что я спорю не с вашей реализацией, а с якобы уже готовым продуктом, т.к. предполагаю, что вы таки своего добились. Настоящие проблемы начинаются дальше.

Думаю у меня, как у безработного с 3 летним стажем нет проблем, проблемы у Интела и его коллег по рынку. Они упёрлись в совместимость и это их и погубит

Не увидел взаимосвязи между безработностью и победой на тупыми инженерами интела

будут чипы с десятками тысяч ядер (если надо будет), спокойно проглатывающие тяжелые операции 4К на 200Гц в реальном времени.
Не будет. По той же причине.Этот монстр будет больше из-за теплорассеивания.

Ну если бы 10 лет кому сказали про тысячи граф.ядер на кристалле — ответ был бы тот же.

А может вспомните, почему частота не растёт, и закон мура теперь не про частоты, а про количество на кристалле? И кстати, количество на кристалле растётквадратично, а то что предлагается — на порядки быстрее.

То есть главный вопрос — зачем то, что Вы собираетесь, нужно?
наверно автору влом изучать HTML))

Ели бы только автору топика. Впечатление другое, никто не хочет изучать монстра и большинство довольствуются WP.

на 21:41 807 просмотров. Кто тут писал, что технические сайты не нужны?

Так это, мне не нужны «специалисты» по английскому языку и теминам, мне нужны зрелые люди с опытом. И кстати, все люди — с улицы.

“Навыки: C++, HTML/CSS, Delphi, MySQL, Ruby/Rails, C”

Удачи :).

Я знаю, что у вас нет хороших спецов

You need Altera Quartus software to compile your own projects
Для того, чтобы вот так с ходу переходить к реализации ультрамодного процессора на FPGA нужно быть просто мега-гуру разработки графических процессоров и вообще очень сильно уверенным в себе специалистом. К сожалению, я так не могу, поэтому склонен согласиться с Вашим мнением :).
мега-гуру разработки графических процессоров
Приведу пример: дядя Билли или Джобс. Главно что бы у папы был гараж или мама в IBM работала. Гуру- муру. Меньше пить надо.Ну ты поставил 13 с iso?
дядя Билли или Джобс
Есть ещё миллионы других людей, выигравших в разнородные леттереи, например, оказавшиеся в нужное время в нужном месте. Но Вы таким не станете, с вероятностью почти 100%, погрешность ничтожна.

Ну и что? я же просил, издеваться по делу. Пока вижу дикое желание у Yaroslav Voytovych забанить всех. Ну не получится. 966 просмотров на 7: 49 утра 4 апреля 14 года

тю .. процессоры ... Та можно более дельную штуку сделать: Пропеллер с емкостью, куда заливают нечто дурно пахнущее. Когда билд ломается или уровень шума от троллинга зашкаливает пропеллер запускается, разбрызгивая содержимое во все стороны , при этом мило помигивая разноцветными лампочками под какой-то рингтон.

Ну просил же, нечего сказать, проходи в топик, что учить джуниору

на этом вы можете прославиться, а на процессорах нет :)

Я не собираюсь ни прославиться, ни даже денег заработать. НО я не вижу кроме поржать никаких аргументов.

Почитайте спецификации OpenGL ES вместе с икстеншенами включительно, и у Вас пропадёт такое желание навсегда.
Сложность контекста настолько велика, что только лишь доведение команды проекта до хоть какого-либо приемлемого понимания предмета — займёт десятки человеко-лет, и можете пересчитать это в деньги.

Я не собираюсь реализовыввать OpenGL E. Он действительно сложен. Но напомню, что всё равно эти сложности реализуются процессором с 4 арифметическими действиями х86. Этот процессор совершенно не годится для обработки изображений.

не собираюсь реализовыввать OpenGL
В таком случае, практическая ценность вашего «детища» — отсутствует.

Совершенно справедливо для OpenGL, но не более

Этот процессор совершенно не годится для обработки изображений
1. Ну насчет «совсем» я бы поспорил. Есть просто какие-то критерии — и по одним подходит (не зря там введены SSE/AVX), по другим — нет. Вы свои критерии пока что так и не озвучили.

2. Что именно Вы вкладываете в «процессор обработки изображений»? Это очень растяжимое понятие. Простейший блюр и распознавание избражений — это два частных случая обработки изображений. Первое — верю, можно в жесткую логику заложить. Второе...

3. CUDA или аналогичные технологии. Очень сильно сомневаюсь, что Вы сможете преплюнуть их в плане производительность/стоимость. Это не беря во внимание еще и стоимость R&D работ. Немного разные сферы применения.

4 арифметическими действиями х86
4. А в логике, на основе которой собираетесь разрабатывать, или же в ЦОС — изначально действий больше? По-любому, весь современный цифровой мир базируется на этих 4-х действиях (плюс-минус, смотря с какой колокольни смотреть %).

Ну и насчет лисепеда:

www.altera.com/...p/ipm-index.jsp
Если внимательно посмотреть — в основном фильтрация (в широком смысле), всякие скейлеры/деинтерлейсеры, кодирование/декодирование, различные преобразования. То есть то, что хорошо ложится на жесткую логику.
Вы собираетесь делать что-то из того, что уже сделали другие? Зачем?
Что-то круче?
Дерзайте (ибо иначе ничего не изобреталось бы никогда) — только это посложнее будет Бейсика от Гейтса %).

«весь современный цифровой мир базируется на этих 4-х действиях» это их проблемы. Теория групп говорит, что коммутативность очень редкое явление в этом мире.

Согласен. Но ведь выбранная Вами для обработки изображений элементная база из того же очень «редкого явления».

Докажите. Вот есть теорема о том, что любой конечный алгоритм можно выразить в качестве конечного автомата, а его собратьиз вентилей 2ИНЕ.

Доказать что?
Это из разряда того, что и обезьяна может написать «Войну и мир», если дать ей в руки печатную машинку и бесконечное время.

Я имел в виду следующее. ПЛИС базируется на некотором множестве базовых операций (вентилей), принимающих ограниченное число значений. Число вентилей тоже ограничено. Это по сути не сильно отличается от арифметики целых чисел. Просто набор других операций, других значений. Не более.
Причем булевая алгебра менее пригодна для реализации общеизвестных алгоритмов обработки изображений, как по мне, за исключением некоторых операций типа сдвига.
Просто пример — возьмите картинку 10×10 и напишите фильтр детектирования границ. Элементарная по сути операция. Сколько вентилей Вам понадобится для этого?
Еще проще. С советских времен помню схемы сумматоров на логических элементах для 4 и 8 бит. Для 1 бита — еще так себе. Для 4-х — ешкин кот, но терпимо. Для 8-ми обычно решалось каскадированием 4-х битных.

В теории было бы удобней иметь набор графических процессоров превышающих на порядок число пикселей, которые можно было бы соединять свободно между собой и пикселями.
Тогда была бы жесть %) Такая себе нейронная сеть с продвинутыми и настраиваемыми нейронами. Может и доживу до такого. Только не уверен, что это будет именно микроэелектроника. Хотя черт его знает.

Позвольте вам маленькую подсказку. Операции с переносом на 1024*1024*16 не получатся

Хорошая идея для стартапа!
Но лучше почитать про OpenCL

Для лечения национальной болячки (хто там думкою багатіє?) было бы неплохо изучить какой-нибудь современный GPU, например Intel HD. Все спецификации лежат тут: 01.org/...umentation-prms . Года через 2-3, после того, как переварите имеющуюся информацию прийдёт понимание, почему описанная в топике идея лишена смысла.

Интел не умеет делать графику, мы уже давно это знаем

Зато Интел умеет делать процессоры: ru.wikipedia.org/wiki/Intel_MIC

Интел делает превосходные процессоры для бухгалтерских расчётов. Прочтите этот абзац.

Очевидно, что в наше время основная вычислительная нагрузка — обработка изображений. Для этого 64 разрядные процессоры слегка не подходят и упёрлись в те проблемы, про которые ваш доклад: Многоядерность мешает одновременному доступу. Или то, или другое.
И вообще архитектура фон Неймана сюда не годится. Начнём с того, что буфер кадра — основное место боёв.Это вместо аккумулятора Видео 4К, а операнды могут быть разные, от 2D спрайтов до вертексов или викселов (3D пикселы).Операции не арифметика, а сдвиг, вращение, масштаб одной машинной командой, изменение цвета или прозрачности по всему операнду, а не циклом. Это всё можно делать на 100 нм ис пониженной тактовой, что минимизирует расход питания. Вот подача и чтение операндов может быть и 10ГГц.Я не прошу вас рассматривать, верен ли такой взгляд на дальнейшее развитие. По моему, он просто неизбежен. Для распознавания образов нужна похожая штука.
elizarov.livejournal.com/...9.html#comments

И вообще архитектура фон Неймана сюда не годится. Начнём с того, что буфер кадра — основное место боёв.Это вместо аккумулятора Видео 4К, а операнды могут быть разные, от 2D спрайтов до вертексов или викселов (3D пикселы).Операции не арифметика, а сдвиг, вращение, масштаб одной машинной командой, изменение цвета или прозрачности по всему операнду, а не циклом.
Я уже читал этот ваш поток сознания, поэтому и сказал, что было бы просто настоятельно необходимо вам ознакомиться с архитектурой современных GPU, чтобы не писать отсебятину в стиле 90х годов, когда каждый уважающий себя программер писал 3D движок и трёхмерный редактор.

Спасибо , мы всё поняли. Отсебятину писали и будем писать,хоть 60-ых. Мы себя не уважаем, и федерализации Украины у нас не будет. С чем вы не согласны конкретно, кроме общего отвращения: Вот фраза отсебятины:
«Очевидно, что в наше время основная вычислительная нагрузка — обработка изображений. Для этого 64 разрядные процессоры слегка не подходят и упёрлись в те проблемы, про которые ваш доклад: Многоядерность мешает одновременному доступу. Или то, или другое.»
Возражайте, но не в загали а по делу.

Для абсолютного большинства задач обработки графической информации хватает float на цвет. А это 32 бита. Зачем там 64 бита как неделимый атомарный размер регистра — хз. То, что вы предлагаете с параллельной обработкой — называется SIMD. Как мешает многоядерность и многонитевость, например, в Cell процессорах? Оно создано, чтобы решать именно ваши задачи, вы же конструируете монстра, который будет заведомо медленнее (ибо у вас нет доступа к тем частотам и тому техпроцессу) и заточен только под одну задачу. Читайте и развивайтесь, ибо вы сейчас похожи на австралопитека, предлагающего новый техпроцесс заточки копья старой межзвёздной цивилизации. Дорогое и непрактичное решение -> прямая дорога ему в сад.

«вы же конструируете монстра, который будет заведомо медленнее», а зачем быстрее, если параллельный монстр? 50-100 кадров в секунду достаточно, и тогда не нужны технологии техпроцессы, 100 нм достаточно. Но есть Альтера,технологи доступны. Вот пример: передвинуть в растре объект размером в 10000000 пикселей требует много циклов в обычном процессоре, вместо одной команды. А OpenGL — векторный подход, что заведомо медленнее и плохо распараллеливается.Особенно трассы лучей

а зачем быстрее, если параллельный монстр?
Вопрос в средствах разработки, в скорости разработки под эту платформу и BOM стоимости конечного продукта. Ваш «продукт» заведомо проигрывает по всем трём параметрам.
Вот пример: передвинуть в растре объект размером в 10000000 пикселей требует много циклов в обычном процессоре, вместо одной команды.
Для перемещения изображения размером в 1024×1024 пикселя скорость копирования будет приближаться к пропускной способности контроллера DDR памяти для любого современного GPU. В чём смысл вашего устройства? В одной команде? Вы не поверите но во всех GPU bitblt и так является одной командой %)

НЕ поверю. И да, я же сказал, фон Нейман не подходит. Структура DDR естественно то же. а SIMD — это как раз фон Нейман

Не подходит для чего?

Мхаил, ну прочтите мой поток сознания внимательно. «не подходит Для обработки изображений».И чего вы так горячитесь? Кризис не у вас и не у меня,а у Интел. Они пару лет назад обещали проц с 64 ядрами для настольных агрегатов. Где он? Они сообразили что больше 8 ядер при нынешнем подходе не катит. Прирост производительности выходит при 4 ядрах до 50%, а при 8 ядрах — дай Бог 30%. Именно потому, что ядра ждут друг-друга. А в CUDA — тоже самое. Но жрут много.

ну прочтите мой поток сознания внимательно. «не подходит Для обработки изображений»
Каких изображений? Какой обработки? То, что есть устраивает всех, а вас не устраивает, вот я и пытаюсь понять, может я где-то лоханулся и последние семь лет жизни потратил на совсем не то, что надо? Обычно решение придумывают под задачу, а не наоборот. У вас есть задача обработки изображений, имеющая промышленную или научную ценность, которую нельзя решить дешевыми стандартными методами?
Они сообразили что больше 8 ядер при нынешнем подходе не катит.
Вы путаете SMP и NUMA с SM. Они все предназначены для разных задач. Ваш пассаж про производительность просто убивает, запустите четыре разных задачи на 4 ядрах и получите 100% на ядро, откуда 50%? Запустите одну и ту же задачу на 192 ядрах и получите гарантированно 100% на ядро.

Обработка изображений это когда вы распознаёте лицо, или генерируете лес в игрушке, с определением границ каждого листочка и герой игры у вас не ходит сквозь дерево, и всё это на обычном смартфоне а не суперкомпьтере для сына богатого папы. Вот наберите поиск «одноногий мужик в пиджаке» и посмотрите результат. Замечательно. И они уверяют, что их программы умеют водить машину без водителя? (Это всё про обработку изображений). 50% ускорения, когда одна программа запускается на одном ядре и она же на 4-х ядрах, а не 4 экземпляра, не юродствуйте.

Как всё запущено :-/

Уважаемый Майк. От вас информации 0, ссылок полезных 0. Просьба, проходте мимо. Из вас плохой преподаватель

Просьба, проходте мимо.
Не дождётесь!
Из вас плохой преподаватель
Ещё из меня плохой танцор и хирург, и что?

Не надо спорить. Ибо дождаться квантового процессора быстрей будет)

дождаться квантового процессора быстрей будет)
Ну ждите. Его не будет

а пацаны то и не в курсе...
www.dwavesys.com

этого не может быть — потому что этого не может быть? :-)
с таким подходом не изобрести велосипед, пардон — «графический процессор», которых и так масса на рынке
а на 512 кубитах между тем, уже можно в онлайне взламывать многие шифры, считающиеся криптостойкими

Я вообще зная немного квантфиз на уровне школьницы не могу понять его пользы. Если мы имеем суперпозицию кванта и все вытекающие. Как узнать результат? Ну умножил числа. А разве «Неопределенность Котэ» :) тут не мешает нам.
Как узнать состояние частицы?

Если он такой крутой этот компьютер. Весь из себя передовой, тогде первые результаты. Что он там считает?

Если не дай бог залетит поток частиц, это не собьет весь результат? Как такой комп будет работать при радиации, например?
Я знаю нежность ячеек RAM. Заряд стикает мгновенно. Пару электронов в конденсаторах. А тут тебе кванты, не те же самые электроны?
Если частицы по меньше, то почему это работает?
Не понял ничего.

Вообще есть на свете люди которые могут сказать «я понимаю квантовую механику»?

Если не дай бог залетит поток частиц, это не собьет весь результат?
в d-wave еще первого поколения
при решении задачи Рамсея непосредственно в вычислениях было задействовано 28 кубитов, остальные 56 использовались для поиска и устранения ошибок :-)
но это было связано не с «космическими лучами», а с конкретной реализацией метода квантовых вычислений
Я знаю нежность ячеек RAM. Заряд стикает мгновенно. Пару электронов в конденсаторах. А тут тебе кванты, не те же самые электроны?
Если частицы по меньше, то почему это работает?
не путайте квантовую математику с квантовой физикой
принцип работы d-wave описан на их сайте

ПРавильно, не надо путать божий дар яишницей. Квантовая физика есть, квантовая математика — фейк

Если мы имеем суперпозицию кванта и все вытекающие. Как узнать результат?
Для этого мы строим процесс решения таким образом, чтобы вероятность ответа, удовлетворяющего критериям правильного, стала много выше верояности любого другого ответа (в этом и сложность программирования квантовых компьютеров — нет вообще никаких привычных программисту операторов, все совсем иначе). Запустив процесс несколько раз и получив один и тот же результат, можно с высокой вероятностью утверждать, что именно этот ответ — правильный (хотя теоретически вероятность ошибки никогда не будет строго нулевой, но можно приблизить ее сколь угодно близко к нулю, повторив одно и то же вычисление много раз подряд)

Не слушайте русскую пропаганду, маркетинг такой маркетинг. Верьте тому, что у вас в руке, остальное одурманивание, «Крым российский», «расшифровка онлайн», «распознавание лиц».

Да я и так скептически ко всему настроен.

Дорогой Настасий! В 70 — годы и ранее и позже американская разведка проводит зондирование идиотов по всему шарику. В 70-е появились стати в западных научных серьёзных изданиях про продольные электромагнитные волны. Сотни людей в СССР защитил диссертации и пару человек — докторские. Под небезызвестной Дубной построили бетонный бассейн за несколько миллионов долларов для проверки связи между подводными лодками с помощью этих самых продольных волн. Это делается для выявления коррупционеров в стране и дальнейшей вербовки идиотов, занимающих должности, которые за бабло все секреты сами принесут. КГБ чаще использовало в этих целях красоток, типа Анны Чапман. Уверен, что квантовая математика — это тоже самое. Поищите, какое научное учреждение в США и фамилии учёных- спецов по квантовой математике. И других отсталых странах, типа Германии, Англии, Франции Японии. И всё станет ясно как божий день. Не перечень, а труды.

Верьте тому, что у вас в руке, остальное одурманивание

Тут немного не корректно. Надо делать из того что под рукой а верить надо в результат.
«По вере вашей да будет вам» (это не пропаганда не боитесь:-)

А OpenGL — векторный подход, что заведомо медленнее и плохо распараллеливается.Особенно трассы лучей
Читать, читать и ещё раз читать! Всё бесплатно и открыто и всё вас ждёт.

На этом форуме что ни напиши скажут что идея лишена смысла, найдется миллион причин ) Во всех аналогичных топиках авторов зафукивают )
Я не эксперт в процессорах и видео, но общая тенденция «почему нельзя» именно такова. Но даже если не получится построить нечто реальное, будет весьма интересный экспириенс и набор дополнительных знаний, так что на мой взгляд все ок )

На этом форуме что ни напиши скажут что идея лишена смысла, найдется миллион причин ) Во всех аналогичных топиках авторов зафукивают )

nVidia тратит на R&D 336M$/year, AMD 293M$/year, Intel 2826M$/year, IBM 1565M$/year. Но тут приходит Андрей Иванов, который копеечной Альтерой через колено перегибает пяти миллиардный r&d пул баксов только четырёх компаний, которые вращаются в этом бизнесе (а их намного больше), при этом даже не изучив предметную область. Тут даже не нервный смех звучит, а недоумевающая икота с изжогой.

Ну пусть наймут снайперов, или набрасывателя на вентилятор

Или сбросятся на клоуна.

Так сплошь и рядом примеры когда на коленке и полубесплатно собирают то, что потом стоит сто миллионов.
И неужели вы не в курсе как это R&D в больших компаниях работает, каждую фигня настолько дорого стоит, что в самом деле приходится тратить эти миллионы.
Личность автора — отдельный разговор. Я не эксперт в теме, поэтому не могу судить. Я только написал что здесь зафукают абсолютно любую идею. Вывод — реализовывать надо по тихому и уж потом хвастаться своей success story на зависть здешним обитателям, так уж тут устроено общение, конструктива мало. Более того, даже реализованная идея будет тоже зафукана потому что местами «не в тренде» сделана и так далее по подобным признакам.

Так сплошь и рядом примеры когда на коленке и полубесплатно собирают то, что потом стоит сто миллионов.

1. Когда последний раз так было в процессоростроении (электронике вообще)?
2. Идеи нет, так что зафукивать нечего. Наброс по типу «можно грабить корованы», там тоже тз было в таком духе.

Вот и замечательно. Вот в 80-е был юбилей журнала «Электроника» (США, русский перевод). Подводили итоги. За 70 лет 3 патента в схемотехнике: положительная обратная связь, отрицательная обратная связ и что-то ещё, сечас не помню, кажется выпрямитель. Про корованы ничего не было.

Ну так делал бы давно уже что-то, а то впечатление что идет поиск людей которые вместо автора топика сделают прорыв электроники

Для лечения национальной болячки (хто там думкою багатіє?
Года через 2-3, после того, как переварите имеющуюся информацию прийдёт понимание, почему описанная в топике идея лишена смысла.
Ну, я, кстати, не был бы так категоричен.
Процессор, в котором бы матрица шейдеров выполняла бы и текстуризацию — накодить на HDL не так уж и сложно, довести драйвера до более-менее рабочего вида...
Я бы взялся за 20 человеко-лет, ну за 50 — максимум. А это — всего 5 лимонобаксов. :)

Ярослав, если их послушать, то для проектированя х86 надо досконально реализовать SQL в металле. Причём тут железо к OPEN GL? Это среднеуровневая абстракция, а я говорю о рапараллеливании миллионов пикселей.Это уровень специального ассемблера.

Если речь идёт о графическом акселераторе, то речь идёт не о миллионах пикселов, а о сложных нелинейных функциях обработки изображений. OpenGL — это всего лишь список функциональности, которую нужно реализовать в железе, чтобы получить сносную картинку на выходе и совместимость с уже написанным софтом.

А как вы относитесь к альтера, НДФ и НКФ, 2И-НЕ и прочей Буливой Алгибре? Или там к полусумматорам?

НДФ и НКФ, 2И-НЕ и прочей Буливой Алгибре? Или там к полусумматорам?
На уровне школотрона мы все к этому относимся (ну кроме выпускников ШАГа, извините пацаны, но вы в пролете).

Ну поставьте себе altera 13.1 и сделайте helloword

Там их шестеро. Впрочем, это оффтоп.

FPGA. Шуму много вокруг них. С алтерой и прочим железом не работал. Но с шейдерами и прочим борохлом я знаком. Он даже про CUDA почитываю.
Но тут немного по другому.
Затариваться надо чем-то?

Нет, ставьте альтеру, я напишу в личку, что делать если разберусь с ней. надо хоть недельку. Я с подобной штукой работал ну очень давно.

Зарегался на алтере. Там этого софта дофига. Какой именно? У меня Linux Mint. Я начал качать, но думаю совсем не то.
Я серьезно думаю попробыать. Не спорте выше. Давайте по делу.

Киньте ссылку. Я скачал для винды все в одном
Вот пример счётчика www.youtube.com/...h?v=If4iiz4I8Vk

ссылку не на файл, а на страницу, где ссылка на файл

Не то скачали надо самую левую закладку. Combined Files

Сумматоры, полусумматоры, регистры, RS-триггеры, T-триггеры, D-тригеры, тактовая частота, передний и задний фронт, дешифраторы, шифраторы, мультиплексоры, демультиплексоры, стек, делители частоты, сдвиг. Но это ерунда. Он в Logism играюсь когда скучно. Потом удаляю, потом снова устанавливаю, и потом все стираю. Процы 8-битки делаю. Но правда зачем эти 8-битки мне!? Никто не оценит.
А что еще надо???

Про обработку изображений. Это GPU? Это анализ данных? Это распознование образов? Это спектрометр какой-то?
Изображений чего? В каком спектре? Инфракраснный? Для орбитального телескопа? Для вебки? Для проф. камеры?

за те же деньги можно купить китайце-человеко-часы. точность распознавание выше, стоимость владения — ниже. легко масштабируется.

спасибо, алэ я просто подЫвлюся.
Предлагаю сначала конкретизировать понятие «обработки изображения».
я отнюдь не спец в процессорах и алгоритмах, но обработка изображений включает в себя настолько много всего, что впихнуть в одну железяку будет проблематично.
А в общем случае не будет ли этот процессор очередным DSP?

Сделайте мне такой процессор, чтобы он вычислял спектр изображения (MxN), 1920×1080 к примеру за один такт, это возможно?

Не знаю, но поиск числа в этом массиве в заданном диапазоне — да, за такт.

К примеру уже на 100Mhz Transfer Rate = 1920×1080×3x10^9 итого 5657 Терабайт в секунду (!),
фигасе у Вас скорости космические, как обработать такой трафик !?
Скорее всего к 2030-у данная разработка станет актуальна, либо DDR9 изобретут

Любая лягушка видит муху за 20 мс, как и человек. У человека приблизительно по 10 Мпс в каждом глазу

даже круче, мне же еще надо 60 кадров в сек. И 1080 это для начала

Как раз наоборот. Мозги лягушки от глаза до мозга — 10 нейронов. В мозгу — тоже около 10 и от мозга до мышцы языка — ещё 10. Итого 30 нейронов. 20 мс делим на 30 нейронов — скорость такта 0.6 мск на нейрон. 10 МГц хватит за глаза, никакого перегрева. Главное массовая параллельность

Вот к тому времени и будет готово

Я между прочим сужу по себе. Примерно тем же занимаюсь. Решаю NP-трудные задачи.

Моё мнение дилетанта P== NP, ведь простое число можно за 4 такта посчитать, просто поделив N на все числа, если у вас есть sqrt(N) процессоров

Задача на миллион лет вычисления одним процессором, все еще остается задачей на год для миллиона процессоров. Ну то есть для некоторых задач sqrt(N) процессоров может оказаться создать сложнее и дольше, чем допилить квантовые вычисления

Моё мнение дилетанта — квантовых вычислений нет в живых организмах.

Конечно нет, но мозги и не решают задачи полным перебором, и они дают не строго оптимальное решение — а только достаточно хорошее в большинстве практически важных случаев

Вот в этом то и проблема что надо иметь эти N процессоров. Задача как раз и состоит в том что бы на одном сделать.

Поскольку вопрос о квантах закрыт, спите спокойно Visa и MasterCard.Геометрию не надуришь и машина времени невозможна.Но вот вычислить максимум за такт в массиве уже можно.

Не совсем за один, но реально можно очень быстро считать. Собственно, коммерчески доступные за пару сотен $ fpga чипы за десятки тактов справятся. Вот только скармливать данные этой системе абсолютно нереально — если еще картинку с камеры можно получить быстро, разместив логику на одном чипе с матрицей камеры (и то это не один такт будет, а тысяча в таком разрешении) — то эталонные изображения как подавать? Ну и, собственно, зачем даже чисто теоретически могут понадобиться сотни миллионов спектров в секунду?

Мне, если честно, так много не надо, надо 60 раз в секунду просчитать.
Но зачем

сотни миллионов спектров в секунду
придумать могу: допустим вы имеете дело с длинными натуральными числами, очень длинными, перемножать их между собой уже выгоднее с помощью БПФ

Ага, 60 в секунду — уже ближе к реальности, но еще очень много. Это, если экономно, нужно на каждый кадр 2 мегабайта загнать туда (8 бит на пиксель сгодится), и 16мб получить обратно (по 32 бита на действительную и мнимую компоненты), итого 18мб*60кадров/с = 8.6 гигабит/с. PCI-e 3й тянет до 8гигабит, так что чисто теоретически — чуть-чуть скромнее, и можно будет уложиться.

Кстати, если все это делается ради фазовой корреляции, то обратно не надо тащить спектр, а только список максимумов — соответственно, уже никаких проблем с передачей данных нет. Если поставить видеокарту типа титана, то она и с вычислениями вовремя управится — зачем спец. процессор?

Если поставить видеокарту типа титана, то она и с вычислениями вовремя управится — зачем спец. процессор?
Это главный вопрос дня.

Нельзя просто так взять и разработать процессор ©

Всё начинается с малого. Подскажите где скачать бесплатно ПО Альтера для проверки примеров

Я так понял надо ПО чтоб потестить всякое VHDL задротство?

Гугл даёт слишком много ссылок. Хотелось бы ссылку от человека, который сам работалсо скачаным. Возможны лажи, вирусы, может есть ссылка на обзор, вобщем совет от того кто отличает Verilog от Prolog. Может есть другие DSL

Надо подождать когда всякие тримы попросыпаются. На стэке пишут, что профи юзают вим+имакс :)

Имах? это Cyclone III, Cyclone IV, MAX II, and MAX V devices; select Arria II and Cyclone V devices? Что такое вим?

stackoverflow.com/...sional-vhdl-ide

Engineers in large semiconductor companies are using emacs/vim for code editing. Integrated Development Environment doesn’t make much sense there, since a project is a few thousand HDL files taken from different places on a *NIX network, setup scripts for a dozen different tools, and cron jobs to do frequent builds.

For simpler FPGA projects developed on Windows I’ve seen people using Borland CodeWright, UltraEdit, and Crimson Editor.

ЗЫ Если чо, то я ничо. На VHDL писал курсач и то это было хз когда.

Там можно задать и проверить тесты, на ПО альтеры?

Зря я полез спорить о таких высоких материях, сейчас проснутся трушные красноглазики и все посоветуют из своих забугорьев.

И оно бесплатное но только до 10000 вентилей 2ИНЕ

Посмотрите, на чем девелопят OpenRISC. МБ, там есть ответ.

Для отладки операций может 10000 и хватит, тут главное скорость разработки. Но всёравно спасибо

Вам нужна ПЛИС, количество выбирайте больше 10000 логических элементов (а не вентилей, 10тыс вентилей — это мало для процессора). Определитесь с платформой (Altera, Xilinx, Lattice and so on) и в бой.

Підписатись на коментарі