Ivan1979 (27 September 2024 - 18:33) писал:
#1532
Отправлено 27 September 2024 - 18:45
Ivan1979 (27 September 2024 - 17:53) писал:
А голоса, мужской и женский, смодулированы на основе Вашего (ваших) голоса (голосов), или это синтез изголосов соответствующего жанра?
А картинки на заставке кто рисовал?
Vourdallaque (27 September 2024 - 18:25) писал:
Отовсюду так и льется "только для вас и только сейчас" и что-то там про мою индивидуальность еще и избранность, если я именно этой бумагой буду опу вытирать
Пипл и не такое хавал, и это схавает )
Сообщение отредактировал Пентагон: 27 September 2024 - 18:47
#1533
Отправлено 27 September 2024 - 18:51
Vourdallaque (27 September 2024 - 18:38) писал:
Пентагон (27 September 2024 - 18:45) писал:
А голоса, мужской и женский, смодулированы на основе Вашего (ваших) голоса (голосов), или это синтез и голосов соответствующего жанра? А картинки на заставке кто рисовал?
Всё может делать Suno, нужно только написать промт описания конечной музыки. Можно детализировать стили и прочие моменты, можно добавлять слова, уточнять где припевы, где повторы. Можно уточнить почти всё, тут зависит от желания и умения промтогенерации (это отдельное искусство). Голоса у меня рандомные. Картинка на заставке тоже от Suno.
Сообщение отредактировал Ivan1979: 27 September 2024 - 18:53
#1535
Отправлено 27 September 2024 - 18:57
Vourdallaque (27 September 2024 - 18:55) писал:
Холли после Пинк Флойда был бы совсем другим, вернее, интересно каким бы он был)
Сообщение отредактировал Ivan1979: 27 September 2024 - 18:57
#1536
Отправлено 27 September 2024 - 19:02
Ivan1979 (27 September 2024 - 18:57) писал:
Холли после Пинк Флойда был бы совсем другим, вернее, интересно каким бы он был)
#1537
Отправлено 27 September 2024 - 19:03
#1538
Отправлено 27 September 2024 - 21:13
"OpenAI, дают всего один час нового Voice Mode в ChatGPT после чего начинается пауза в 8 часов, вот мои наблюдения так как я уже третий день трачу эти лимиты:
– Я все меньше верю в мрачный депрессивный киберпанк который мы обычно видели в кино-комиксах-играх про АИ: этот голосовой ассистент очень эмпатийный, говоря с ним люди точно будут учиться тому как выглядит здоровое, не токсичное общение и учиться базовым социальным навыкам. Если раньше, я думал, что это довольно депрессивно, что человек запертый у себя в комнате круглые сутки и не выходящий за пределы имейджборд обречен на отношения с LLM-вайфу, то теперь мне кажется, что те аноны кто хотят вернутся и наладить социальную жизнь, получат полноценный тренажер «IRL жизни» – ассистент никогда не осудит, не будет серьезно стебаться (на легкие темы – будет), с ним можно разбирать самые базовые пробелы в образовании и все это за $20 в месяц
– Новая версия приложения сделана так, чтобы вы запустили ассистента, положили в карман, и болтали с ним как по телефону в наушниках – я прошелся по улице практикуя свой техасский акцент, чуть не умер со стыда, но работает
– В opensource нет решений такого уровня, все что есть работают сильно хуже – они конечно, начнут появляться, но я бы не рассчитывал что в ближайший год у нас будет такое бесплатно и локально
– Внутри Advanced Voice Mode все еще версия gpt4o которую можно промпт-инженерить, то есть если вам нужно получить сложный ответ, то придется надиктовать «цепочку мыслей» – теперь промпт-инженеры могут произносить свои «спеллы» устно и модель будет их слушать, все как у волшебников
– Ассистент отказывается петь в любом виде, OpenAI явно боится нарушить копирайты
– Ждем выкатки поддержки видео-фида во время разговоров – потому, что сейчас ассистенту не показать реальный мир
– Классно работает интеграция с памятью – если во время разговора вам что-то понравилось, просто попросите АИ это запомнить
– А вот поиск в интернете в Advanced Voice Mode почему-то не добавили, хотя у прошлой версии он есть
– Если вы любите/хотите чему-то учиться – покупайте VPN в США и ставьте ChatGPT апп, это штука лучший учитель на замену средненьких (любимых талантливых преподавателей она не заменит конечно, но они большая редкость)
– Если честно, будь я учителем, я бы сильно напрягся – эта штука позволяет практиковать любой язык или разбирать любую сложную тему «на лету», то есть вырабатывается привычка запускать этот новый режим (с прошлым было не так, видимо работает «натуральность» общения). Если вы такой учитель, то вместо того чтобы пугаться, лучше поставьте себе и попробуйте сами, а еще лучше начните применять в работе как-то – эта технология с нами уже навсегда"
Я тоже разговариваю с чатом, мы обсуждаем особенности южного акцента и южной сленговой грамматики, после Колорадо язык во Флориде кажется почти техаским)) Он меня учит, тренирует, проверяет, исправляет. Это, конечно, удивительный опыт - просто общаться с ИИ как с живым собеседником.
Сообщение отредактировал Ivan1979: 27 September 2024 - 21:17
#1541
Отправлено 28 September 2024 - 12:04
Maшa (28 September 2024 - 07:57) писал:
Как связана реклама с "ИИ"
Сообщение отредактировал Ivan1979: 28 September 2024 - 12:14
#1542
Отправлено 30 September 2024 - 04:29
Против закона выступали Google, Meta, Microsoft и OpenAI, к которым присоединились также более мелкие компании. Основные возражения касались того, что формулировки закона носят расплывчатый характер, при этом запрещая разработчикам выпускать модели, если существует "необоснованный риск". Неопределенность формулировок оставляла большое поле для толкований и фактически позволяла осложнить работу компаний, пока с вопросом не разберутся в суде, например.
#1543
Отправлено 30 September 2024 - 13:59
Детали о том, когда и как будут проходить сессии просмотра данных, пока неизвестны и вряд ли будут.
Сообщение отредактировал Ivan1979: 30 September 2024 - 14:01
#1544
Отправлено 30 September 2024 - 16:30
#1545
Отправлено 30 September 2024 - 16:48
Разработчик Оскар Вилмердинг создал необычную фотокамеру на базе Raspberry Pi. Устройство способно не только снимать фото, но и обрабатывать их и создавать на их основе новые изображения при помощи искусственного интеллекта. Проект получил название AI EYE.
Камера работает следующим образом: когда фото сделано, ИИ-алгоритм обрабатывает его и создаёт подробное текстовое описание. Это описание затем анализируется другой моделью, которая генерирует по нему новую картинку с нуля. Устройство позволяет добавить свои пожелания к стилю сгенерированной картинки: например, «таинственный», «мрачный», «спокойный» и другие.
Камера разработана на базе Raspberry Pi Zero 2 W и питается от литий-ионной батареи 3,7 В. Всё вместе плюс печатная плата и 3,5-дюймовый ЖК-дисплей заключено в корпус, напечатанный на 3D-принтере. Обработка изображений при помощи ИИ происходит в облаке, а не локально на устройстве. Для этого используются две системы: Astica Vision для создания текстовых описаний и DALLE 3 для генерации новых изображений.
https://www.reddit.c...generates_your/
#1547
Отправлено 01 October 2024 - 00:26
baryshnikv (30 September 2024 - 22:40) писал:
#1550
Отправлено 01 October 2024 - 17:31
№13 (01 October 2024 - 15:39) писал:
Сообщение отредактировал Ivan1979: 01 October 2024 - 17:32
#1551
Отправлено 01 October 2024 - 18:39
https://www.theverge...hotos-upscaling
#1552
Отправлено 01 October 2024 - 21:34
Улучшенный поиск Windows впервые появится в проводнике файлов на ПК Copilot Plus в следующем месяце, позволяя искать изображения с помощью слов, даже если искомое слово не найдено в имени фотографии или файла.
https://www.theverge...solution-photos
#1553
Отправлено 01 October 2024 - 22:18
Немецкий суд вынес неожиданное решение по иску фотографа, который обвинял компанию LAION, занимающуюся созданием библиотеки изображений. Библиотека изображений LAION используется рядом компаний для тренировки моделей AI. Фотограф Роберт Кнешке в апреле 2023 года обнаружил большое количество своих фотографий в этой библиотеке и потребовал у компании удалить их оттуда. Компания отказалась это сделать, указав, что не хранит копии фотографий, а лишь составляет и поддерживает базу данных, содержащую ссылки на публично доступные изображения.
Когда разбирательство перешло в суд, тот принял неожиданное решение — поскольку компания не ведет коммерческую деятельность с помощью этой базы данных, то этот случай подпадает под статью 60(d) закона об авторском праве ФРГ, которая разрешает использование и копирование работ, охраняемых авторским правом, в исследовательских целях, даже если автор работ отказался от такого использования. Как отдельно отметил суд в решении, тот факт, что в дальнейшем эти данные используются коммерческими организациями, не делает LAION ответственными за деятельность этих организаций.
Это решение может иметь очень разнообразные последствия. Представьте себе целую толпу немецких научных фондов, которые займутся составлением таких наборов данных, совершенно законно не обращая никакого внимания на претензии правообладателей, например.
https://petapixel.co...obert-kneschke/
#1554
Отправлено 02 October 2024 - 18:55
Q: Насколько мы близки к созданию AGI (Artificial General Intelligence)?
A: Раньше было легко определить, почему тот или иной продукт не является AGI, но сейчас это становится все сложнее. Модель O1 явно соответствует второму уровню, хотя в некоторых важных аспектах она еще не ощущается как AGI (имеются ввиду уровни автономности AGI). Мы активно работаем над развитием агентных возможностей, и если сравнить O1 с GPT-4 прошлого года, разница поразительна. Ожидайте стремительного прогресса как минимум в ближайшие два года. Мы находимся в размытой зоне — это AGI или нет? В скором времени это перестанет иметь значение. Мы продолжаем двигаться по плавной экспоненциальной кривой развития.
Q: Сохраняет ли OpenAI прежнюю приверженность исследованиям, как и раньше?
A: Да, и даже больше, чем когда-либо. Наша миссия — создать безопасный AGI. Если решение заключается в увеличении количества GPU, мы это сделаем, но сейчас все сосредоточено на исследованиях. Каждые несколько месяцев появляются новые возможности, которые меняют направление наших разработок. OpenAI гибко реагирует на то, что работает или нет, и быстро адаптируется. Хотя правительство хочет получать уведомления за 60 дней о новых возможностях, мы часто движемся быстрее.
Q: Правда ли, что OpenAI теперь лишь формально уделяет внимание проблеме выравнивания (alignment)?
A: Наш подход изменился, но мы по-прежнему стремимся создавать более мощные модели, которые работают безопасно. Новые модели приносят новые вызовы. Важно понять, куда движутся возможности, и затем обеспечить их безопасное развертывание. Безопасные системы поддерживаются набором инструментов. Модели должны быть в целом безопасными и надежными для применения в реальном мире. Когда мы создавали GPT-3, мы даже не задумывались о вещах, которые важны сегодня, потому что тогда они не существовали! Мы придерживаемся итеративного подхода, постоянно улучшаясь.
Забота о возможных научно-фантастических сценариях важна, но мы не ограничиваемся только этим. Мы хотим подходить к проблемам с разных сторон. Главное — итеративное развертывание.
Q: Как вы видите роль агентов в реальном мире?
A: O1 и его возможности рассуждения сделают агентов реальностью. Чат-интерфейсы отличны и важны, но когда вы можете попросить модель выполнить многошаговые взаимодействия с миром быстрее и дешевле, чем это могут люди, это существенно изменит то, как функционирует мир в очень короткие сроки. Люди быстро привыкают — спустя всего лишь 20 минут в автономном автомобиле вы уже не впечатлены и пялитесь в телефон.
Когда возможности улучшаются, ожидания растут: если компьютер выполняет задачу за час, вы хотите, чтобы это заняло минуту. Одна из самых увлекательных вещей в OpenAI — наблюдать за невероятно быстрым развитием идей и проектов со стороны разработчиков. Мы планируем быть небольшой частью агентов в мире; основную роль будут играть разработчики.
Q: Какие препятствия существуют для того, чтобы агенты управляли компьютерами?
A: Основные вызовы — безопасность и выравнивание. Люди готовы уступить контроль, но стандарты безопасности высоки. Важно разработать рамки безопасности и доверия.
Q: Может ли безопасность выступать ограничивающим фактором для технологий? Это приведет к более эгалитарному миру?
A: Да, это вероятно. Мы начинаем с консервативного подхода. Если вы хотите, чтобы O1 вас оскорбил, он, вероятно, должен следовать вашим инструкциям. Но мы будем консервативны, потому что система станет гораздо более мощной в короткие сроки, и мы всегда можем ослабить ограничения.
Q: Что должны создавать стартапы с использованием API OpenAI?
A: Стартапам следует создавать то, что модели ИИ пока едва не могут делать — то, что почти не работает сейчас, но будет работать со следующим обновлением, и вы будете первыми. Технология почти никогда не является причиной для создания стартапа. Вам нужно создавать накопленные преимущества (accumulated advantage) со временем. Крутой сервис не освобождает вас от необходимости иметь хороший бизнес. Люди склонны забывать об этом.
Q: Голосовой режим взаимодействует с человеческой природой. Как вы предотвращаете злоупотребления?
A: В голосовом режиме трудно не использовать вежливые фразы. Даже я говорю "пожалуйста" ChatGPT. По мере того как эти системы становятся все более способными, они будут затрагивать те части нашего мозга, которые развивались для взаимодействия с другими людьми. Голосовой режим должен преодолеть эффект "зловещей долины". Я рекомендую говорить "пожалуйста" и "спасибо" ChatGPT — это, вероятно, хорошая привычка, никогда не знаешь.
Q: Когда появятся вызовы функций в O1?
A: Вероятно, до конца года. Модель будет становиться лучше очень быстро. Мы знаем, как масштабироваться от GPT-2 до GPT-4, и сделаем это для O1.
Q: Какие возможности конкурентов вы заценили?
A: Google NotebookLM действительно впечатляет. Это новая и хорошо сделанная вещь. Сам формат довольно интересен, а голосовые возможности очень приятны.
Q: Как вы балансируете между тем, что пользователям может понадобиться, и тем, что им на самом деле нужно?
A: Вы должны решать насущные потребности сегодняшнего дня. Это реальный вызов — научить людей использовать ChatGPT и его новые возможности. Многие люди до сих пор не осознают всю магию и преимущества.
В основном мы верим, что по мере того, как мы продолжаем повышать интеллект системы, люди сами найдут способы строить новые продукты на ее основе, и именно это будет действительно важно. Я стремлюсь интегрировать передовые разработки в продукты.
Q: Планируете ли вы разрабатывать Вопрос: модели специально для агентных случаев использования?
A: Агентные модели являются приоритетом на ближайшие несколько месяцев, но не в специфическом смысле — мы стремимся к тому, чтобы все модели были агентными и были лучшими в мире.
Q: Используется ли внутри OpenAI собственные разработки? (Dog fooding)
A: Да, мы используем промежуточные контрольные точки для внутреннего использования.
Q: когда уже О1 работники в OpenAI
A: Пока еще не O1, но скоро будет. Уже сейчас 20% команды поддержки клиентов — это ИИ. Многие процессы безопасности автоматизированы. Внутри компании есть множество примеров.
Речь идет о использовании цепочки моделей, которые действительно хороши в том, что делали люди.
Q: Есть ли планы поделиться моделями для офлайн-использования?
A: Мы открыты к этому, но это не является высоким приоритетом, у нас пока недостаточно ресурсов. Это не то, что произойдет в этом году.
Q: Многие государственные учреждения могли бы получить пользу от моделей, которые еще не развернуты. Что вы об этом думаете?
A: Учреждениям не стоит ждать появления AGI, чтобы начать участвовать. Мы хотим помочь правительствам получить пользу от технологий. Сейчас есть огромный потенциал для добра — присоединяйтесь.
Q: Каковы ваши мысли об открытом исходном коде?
A: Открытый исходный код — это замечательно, и если бы у нас было больше ресурсов, мы бы открыли больше наших разработок. Уже существуют хорошие модели с открытым исходным кодом. Для нас это вопрос того, что если мы этого не сделаем, мир этого не получит.
Q: Почему мы не можем разрешить пение для advanced voice mode?
A: Я сам задавал этот вопрос 4 раза. Проблема в авторских правах на песни. Сейчас это сложный и тонкий вопрос. Мы хотим, чтобы модели могли петь, но пока это невозможно.
Q: Каково будущее длины контекстного окна? Как балансировать между длиной окна и извлечением из памяти (RAG)?
A: Контекст длиной в млн токенов используются меньше, чем я ожидал. Когда мы перейдем от 10 миллионов к 10 триллионам (бесконечный контекст)? Для OpenAI увеличение длины контекста до миллионов токенов — вопрос месяцев.
Сообщение отредактировал Ivan1979: 02 October 2024 - 18:55
#1556
Отправлено 03 October 2024 - 20:00
#1557
Отправлено 03 October 2024 - 22:44
"За последние ~2 часа я подготовил новый подкаст из 10 эпизодов под названием «Истории тайн».
10 эпизодов этого сезона:
Episode 1: The Lost City of Atlantis
Episode 2: The Baghdad Battery
Episode 3: The Roanoke Colony
Episode 4: The Antikythera Mechanism
Episode 5: The Voynich Manuscript
Episode 6: The Late Bronze Age Collapse
Episode 7: Wow! signal
Episode 8: Maria Celeste
Episode 9: Göbekli Tepe
Episode 10: LUCA: The Last Universal Common Ancestor
Процесс:
- Я исследовал интересные темы с помощью ChatGPT, Клода, Google
- Я связал NotebookLM с записью Википедии по каждой теме и сгенерировал аудио подкаста
- Я также использовал NotebookLM для написания описаний подкастов/эпизодов.
- Ideogram для создания всего цифрового искусства для эпизодов и самого подкаста
- Spotify для загрузки и размещения подкаста
Я сделал это в качестве исследования пространства возможностей, открытых генеративным ИИ, и рычагов, предоставляемых использованием ИИ. Тот факт, что я могу, как один человек, за 2 часа курировать (не создавать, а курировать) подкаст, я считаю невероятным. Я также полностью понимаю и признаю потенциальную и немедленную критику здесь, когда сгенерированный ИИ мусор захватывает Интернет. Думаю, послушайте подкаст, когда в следующий раз пойдете гулять/поедете на машине, и посмотрите, что вы о нем думаете."
Народ пишет, что подкаст очень крутой...
Послушайте, у кого есть доступ (а вдруг) и у кого свободный английский (а вдруг)...
Впрочем, сейчас можно перевести на какой-угодно с помощью того же ИИ
Сообщение отредактировал Ivan1979: 03 October 2024 - 22:45
#1558
Отправлено 04 October 2024 - 00:47
Ivan1979 (03 October 2024 - 22:44) писал:
Даю ссылку на самый понравившийся подкаст, вдруг у вас есть возможность открыть, спотифай вроде бы не запрещен в РФ
https://open.spotify...WanD7mmP0dzOkzc
Сообщение отредактировал Ivan1979: 04 October 2024 - 00:51
Количество пользователей, читающих эту тему: 1
0 пользователей, 1 гостей, 0 анонимных