Дайджест #1
![](/file/c3e7df9fc65057eac5617.png)
Привет! Мы решили раз в месяц публиковать дайджесты с кратким обзором всего, что интересного происходило в околорациональной сфере за последнее время. Вот наша первая подборка, с которой помог Денис.
🔹 LessWrong:
• Команда LessWrong преобразовалась в Lightcone Infrastructure и набирает людей для работы в заливе Сан-Франциско (Bay Area);
• Lsusr симулировал Юдковского с помощью GPT-3 и опубликовал пост
I wanted to interview Eliezer Yudkowsky but he's busy so I simulated him instead.
🔹 Посты на тему AI Safety с большинством upvote'ов за последнее время:
• Команда Redwood Research запустила проект по дообучению языковой модели таким образом, чтобы она всегда дополняла тексты без описаний насилия (и при этом была не хуже изначальной модели). Поэкспериментировать можно здесь;
• On Solving Problems Before They Appear: The Weird Epistemologies of Alignment by adamShimi;
• [Question] How to think about and deal with OpenAI by Rafael Harth;
• The theory-practice gap by Buck;
• The alignment problem in different capability regimes by Buck;
• Jitters No Evidence of Stupidity in RL by 1a3orn;
• How truthful is GPT-3? A benchmark for language models by Owain_Evans;
• Robert Miles выложил на своём канале новое видео We Were Right! Real Inner Misalignment, в котором он разбирает результаты из статьи Objective Robustness in Deep Reinforcement Learning.
🔹 Блоги:
• Holden Karnofsky, один из директоров Open Philanthropy и сооснователь благотворительной организации GiveWell, начал вести свой блог Cold Takes и публикует в нём цепочку The Most Important Century о том, что мы живём в невероятно важное время. Первый пост: All Possible Views About Humanity's Future Are Wild;
• Скотт Александер (Scott Alexander) опубликовал посты: Whither Tartaria? с рассуждениями об изменениях в искусстве/архитектуре и их причинах, Too Good To Check: A Play In Three Acts об историях, которые слишком хороши, чтобы проверять их подлинность (в контексте новостей в Америке), пост The Unbearable Semiheaviness Of Being о влиянии тяжелой/легкой воды на здоровье и пост Long COVID: Much More Than You Wanted To Know; ещё у Скотта вышло несколько обзоров книг: Book Review: The Scout Mindset, Book Review: The Revolt Of The Public, Book Review: Modi - A Political Biography;
• Jacob Falkovich порассуждал об общих принципах обучения в посте Rules for Noobs.
Комментарии по содержанию и формату, а также ссылки, которые стоит включить в будущие выпуски, приветствуются.