Дайджест #1

Дайджест #1


Привет! Мы решили раз в месяц публиковать дайджесты с кратким обзором всего, что интересного происходило в околорациональной сфере за последнее время. Вот наша первая подборка, с которой помог Денис.


🔹 LessWrong:

   • Команда LessWrong преобразовалась в Lightcone Infrastructure и набирает людей для работы в заливе Сан-Франциско (Bay Area);

   • Lsusr симулировал Юдковского с помощью GPT-3 и опубликовал пост
I wanted to interview Eliezer Yudkowsky but he's busy so I simulated him instead
.


🔹 Посты на тему AI Safety с большинством upvote'ов за последнее время:

   • Команда Redwood Research запустила проект по дообучению языковой модели таким образом, чтобы она всегда дополняла тексты без описаний насилия (и при этом была не хуже изначальной модели). Поэкспериментировать можно здесь;

On Solving Problems Before They Appear: The Weird Epistemologies of Alignment by adamShimi;

   • [Question] How to think about and deal with OpenAI by Rafael Harth;

   • The theory-practice gap by Buck;

   • The alignment problem in different capability regimes by Buck;

   • Jitters No Evidence of Stupidity in RL by 1a3orn;

   • How truthful is GPT-3? A benchmark for language models by Owain_Evans;

   • Robert Miles выложил на своём канале новое видео We Were Right! Real Inner Misalignment, в котором он разбирает результаты из статьи Objective Robustness in Deep Reinforcement Learning.


🔹 Блоги:

   • Holden Karnofsky, один из директоров Open Philanthropy и сооснователь благотворительной организации GiveWell, начал вести свой блог Cold Takes и публикует в нём цепочку The Most Important Century о том, что мы живём в невероятно важное время. Первый пост: All Possible Views About Humanity's Future Are Wild;

   • Скотт Александер (Scott Alexander) опубликовал посты: Whither Tartaria? с рассуждениями об изменениях в искусстве/архитектуре и их причинах, Too Good To Check: A Play In Three Acts об историях, которые слишком хороши, чтобы проверять их подлинность (в контексте новостей в Америке), пост The Unbearable Semiheaviness Of Being о влиянии тяжелой/легкой воды на здоровье и пост Long COVID: Much More Than You Wanted To Know; ещё у Скотта вышло несколько обзоров книг: Book Review: The Scout Mindset, Book Review: The Revolt Of The Public, Book Review: Modi - A Political Biography;

   • Jacob Falkovich порассуждал об общих принципах обучения в посте Rules for Noobs.


Комментарии по содержанию и формату, а также ссылки, которые стоит включить в будущие выпуски, приветствуются.


Report Page