LINUXTALKS.CO

Почему нет систем машинного зрения с тремя камерами?

 ,

L


0

1

Дело в том что как я прочитал в одной статье о оптических иллюзиях типа вогнутая или выгнутая поверхность эти иллюзии существуют только потому что человек смотрит на мир не тремя, а двумя глазами что его вынуждает мозг восстанавливать недостающую информацию о глубине на основе градиента тона, которые в некоторых случаях(иллюзиях) порождают неправильное восстановление осматриваемой трёхмерной сцены.

Так как иллюзии носят геометрическую природу то те-же самые проблемы должны испытывать и системы машинного зрения.

А теперь вопрос: почему нет систем машинного зрения с тремя камерами если терокулярное зрение позволит точно восстанавливать трёхмерную сцену ввиду чего не будет иметь склонность к иллюзиям возникающим при восстановлений трёхмерной сцены на основе градиента яркости?

★★★
Ответ на: комментарий от Anoxemian

Если надо корректно воспринимать трёхмерную форму таракана то глаз надо три.
Дело в том что при двух и одной камере трёхмерную картину надо довосстанавливать на основе анализа тонов с помощью принципеиально неполной и неопределённой модели реального мира, для трёх камер такой анализ не нужен, вся нужная информация о геометрии уже есть в трёх изображениях.

torvn77    
★★★
Последнее исправление: torvn77 (всего исправлений: 1)

Linux / Chrome (RU)
Ответ на: комментарий от torvn77

Да ну, глупости, третий глаз нужен как бы изнутри, чтобы ты мог смотреть из таракана на два глаза и двумя глазами на глаз таракана. Эффект присутствия, более точное позиционирование, чем твоя хуйня. Воспринимать объем за счет параллакса - гибель, надо сразу смотреть со всех сторон.

Anoxemian    
★★
Anonymous / Unknown (EE)
Ответ на: комментарий от torvn77

Тебе еще нужен четвертый глаз, который бы смотрел в противоположном направлении от таракана, который смотрит на два рассматривающих его глаза, чтобы какбы символизировать хтонтческий пиздец и чуть-чуть экзистенционального, смотрящий строго прямо, без объема вовсе, лишь бы не на сцену уебка, рассматривающего таракана одновременно извне и снаружи.

Anoxemian    
★★
Anonymous / Unknown (EE)
Ответ на: комментарий от Werenter

Я пока не о написании, а о причинах из-за которых обходятся одной или двумя камерами при том что система машинного зрения с ними должна быть сложнее, а не пишут систему машинного зрения с тремя камера при том что её программирование должно быть более простым?

torvn77    
★★★
Android / Chrome (RU)
Ответ на: комментарий от torvn77

Вот читаю я твой пост и думаю, вот зачем я задал умный вопрос там, где ответы пишет кучка идиотов?

Странное высказывание на форуме для кучки идиотов.

anonymous    

Windows / Chrome (IL)

терокулярное зрение позволит точно восстанавливать трёхмерную сцену

Сомнительно.

ввиду чего не будет иметь склонность к иллюзиям возникающим при восстановлений трёхмерной сцены на основе градиента яркости

Как?

Нужно пригласить тестировщика с тремя глазами что бы проверить. Ну и обучающий датасет отсортировать.

rezedent12    
★★★★★★
Windows / Firefox (RU)
Ответ на: комментарий от torvn77

а не пишут систему машинного зрения с тремя камера при том что её программирование должно быть более простым

С увеличением числа камер действует закон убывающей отдачи.

Если ты в одном месте расположишь несколько камер, к тому же одинаковых, это почти не даст преимуществ. А разместив две камеры по краям автомобиля, то есть максимально разнеся, ты получишь преимущества бинокулярности. Однако разместив ещё одну камеру по центру, ты получишь почти ничего.

Но как ты шиз мог догадаться, причина не инженерная, а маркетинговая. В рамках движения ШПШ, объясню её в другом сообщении.

rezedent12    
★★★★★★
Windows / Firefox (RU)
Ответ на: комментарий от rezedent12

Однако разместив ещё одну камеру по центру, ты получишь почти ничего.

Камеры ставятся не по линии, а в вершины треугольника.

Так же оптические оси всех камер сходятся в одной точке.

torvn77    
★★★
Последнее исправление: torvn77 (всего исправлений: 1)

Android / Chrome (RU)
Ответ на: комментарий от torvn77

Причина не инженерная.

Самая громкая авария с «автопилотом» Илона Маска, это когда компьютер автомобиля не смог различить белый прицеп грузовика. То есть две камеры расположенные почти по ширине автомобиля, не смогли различить объект. А видимые внизу колёса, алгоритмы не смогли представить как одно транспортное средство.

Перед технологическими гигантами предстаёт огромный рынок автоматизированных грузоперевозок. А быть водителем грузовика в США, по часто единственный способ относительно хорошо зарабатывать без образования. Ты можешь поинтересоваться темой, водители в США фактически превращают свои тягачи в мобильное постоянное жильё. Короче, это всё издержки которые можно сократить, а вернее разделить как прибыль, между технологическими гигантами и технологическими гигантами.

Вопрос состоит в том, что бы убедить общественность доверять технологии и принять риски. Недостаточно доказать что автопилот ошибается реже, люди не умеют интуитивно математически корректно сравнивать малые риски, они их сравнивают по степени драматичности. Volkswagen и многие другие, пошли по пути совершенствования лидаров. Требуется в основном снизить цену пригодных для массового использования лидаров. Они инвестируют в это. Илон Маск решил запрыгнуть в нишу при помощи нейросетей, обогнать гигантов с помощью пиара. То есть пока они совершенствуют лидары и договариваются с регуляторами, при помощи пиара склонить общественное мнение на принятие автопилота и получить рынок раньше них. Штат который первым позволит использовать «автопилот» на дорогах общего пользования без присмотра человека, перетянет на себя много деловой активности и соберёт больше налогов чем его соседи, а его соседи соберут меньше и что бы не отстать, тоже позволят роботам кататься по шоссе. А всем остальным в мире придётся повторять и за дорого покупать доступ к технологии, что бы не терять конкурентоспособность своей экономики.
От добавления ещё нескольких камер, способности автопилота не вырастут заметным образом. Но возрастёт необходимая мощность компьютера для обработки видеопотоков.
Дело не в математической вероятности ошибок, они всё равно будут и каждый случай пресса будет раздувать. Дело в восприятии ошибок. То есть что бы Илон Маск мог сказать что то типа - «Человек неизбежно ошибся бы так же. Но вот есть статистика, которая показывает что в схожих случаях автопилот ошибается реже чем человек.»

Две камеры автомобилю нужны потому что у человека 2 глаза. Нет задачи исключения ошибок, есть задача очеловечивания ошибок. Камер конечно поставят больше 2, но опять же, справа и слева. Поставят камеры другого угла обзора или другого спектра.

rezedent12    
★★★★★★
Windows / Firefox (RU)

Хз… давно я физику не курил.
Мне кажется, что система с 3 камерами вносила бы больше шумов в результирующую картину.
И, возможно, более сложное управление нужно.

Minona    
★★★★★★
Windows / Yandex (RU)
Ответ на: комментарий от rezedent12

Перед технологическими гигантами предстаёт огромный рынок автоматизированных грузоперевозок. А быть водителем грузовика в США, по часто единственный способ относительно хорошо зарабатывать без образования. Ты можешь поинтересоваться темой, водители в США фактически превращают свои тягачи в мобильное постоянное жильё. Короче, это всё издержки которые можно сократить, а вернее разделить как прибыль, между технологическими гигантами и технологическими гигантами.

Начнётся война.

Minona    
★★★★★★
Windows / Yandex (RU)
Ответ на: комментарий от rezedent12

Так мне вот что не понятно, если задача и так сложная, то зачем выбирать вариант с одной или двумя камерами которые требуют более сложное программирование, когда три камеры должны программироваться проще и скорее всего требуют меньше вычислений?
Да и допустим что использование трёх камер увеличит мощность потребления компьютера на два или три килловата, что эти два три киловатта в масштабе энергопотребления грузовика или тем более автотрейлера?

torvn77    
★★★
Android / Chrome (RU)
Ответ на: комментарий от torvn77

когда три камеры должны программироваться проще и скорее всего требуют меньше вычислений?

Ты это пишешь так как будто это нечто само собой разумеющееся. А для меня это не изученный спорный вопрос.

Да и допустим что использование трёх камер увеличит мощность потребления компьютера на два или три килловата, что эти два три киловатта в масштабе энергопотребления грузовика или тем более автотрейлера?

Это не вопрос энергопотребления. Это даже не вопрос увеличения числа NPU. А оно ведь может оказать не линейным, а геометрическим.

Технология опирающаяся исключительно на анализ нейросетями изображений с камер, при любом их разумном количестве, не готова для безопасного применения. Ты забываешь тот факт, что автомобиль движется. То есть точка обзора постоянно меняется, то есть в половине секунды видео, есть изображения из 60 точек обзора. Зачем ставить третью камеру, когда можно на пару кадров в прошлое заглянуть? Ты конечно найдёшь причину, у меня нет в этом сомнений. Но твоя идея не решает принципиальных проблем систем полагающихся на нейросети в формировании трёхмерной карты окружения по данным от видеокамер.

Стратегически Tesla решает другую задачу, задачу общественного принятия рисков в массовом сознании, которое не умеет рационально считать риски. Не инженерную задачу, а политическую, психологическую.

Моя позиция состоит в том, что без лидаров или чего то аналогичного им, никакое количество камер не обеспечат максимальную теоретическую безопасность. Да и этого я считаю будет недостаточно. Нужно автопилоты дополнить виртуальным дублированием всей дорожной разметки в централизованной базе данных.

rezedent12    
★★★★★★
Windows / Firefox (RU)
Ответ на: комментарий от rezedent12

Но твоя идея не решает принципиальных проблем

Если по одному суммарному кадру можно будет точно, без интерпретации на основе моделей переотражения, рассеяния и переизлучения света, установить трёхмерную сцену то нейросеть будет получать более качественный материал для управления машиной.

К стати упомянутый тобой случай когда автопилот принял близкостоящий грузовик за дорогу как раз подходит под определение случая ошибки восстановления трёхмерной сцены по модели рассеяния и переотражения света, при трёх камерах такой аварии могло бы и не быть.

torvn77    
★★★
Android / Chrome (RU)
Ответ на: комментарий от rezedent12

Моя позиция состоит в том, что без лидаров или чего то аналогичного им, никакое количество камер не обеспечат максимальную теоретическую безопасность.

Несколько синхронизированных и оптически согласованных камер сделают то же самое лучше и надёжнее.

Лидар в принципе не знает к чему он измерил расстояние.

torvn77    
★★★
Последнее исправление: torvn77 (всего исправлений: 1)

Android / Chrome (RU)
Ответ на: комментарий от torvn77

когда автопилот принял близкостоящий грузовик за дорогу

За небо.

то нейросеть будет получать более качественный материал для управления машиной

Не факт что она сумеет им воспользоваться. Я как то смотрел «тепловые карты» нейросетей. Они сортируя объекты «смотрели» совсем не на то на что смотрят люди.

Очень многие нейросети обучаются не распознавать объекты, а использовать утечки информации. Это распространённая проблема.

rezedent12    
★★★★★★
Windows / Firefox (RU)