Популярность кинофильма вдохновила многих изобретателей на поиски метода воспроизведения сопровождающего звука. Для этого требовалось два процесса: запись и воспроизведение. Кроме того, звук должен был воспроизводиться в зрительном зале и быть достаточно качественным. Этого нельзя было достичь без хорошего усилителя электрических сигналов. В 1907 году Ли де Форест изобрел Audion — трехэлементную вакуумную трубку, которая в начале 1920-х годов стала основой для создания реального усилителя, воспроизводящего неискаженный звук достаточной громкости.
Далее возникла проблема синхронизации звука с изображением. Главной трудностью оказалось обеспечение постоянной скорости как в магнитофоне, так и в репродукторе. Было испробовано множество гениальных идей. В 1918 году в Германии изучалось использование модулированной лампы накаливания для фотографической записи звука и фотоэлемента для воспроизведения. В Дании в 1923 году были разработаны осциллографический модулятор света и репродуктор на селеновых элементах. Де Форест попробовал использовать газонаполненный тлеющий разряд, работающий от телефонного передатчика, для записи синхронизированной звуковой дорожки на пленку. Для громкоговорителей он экспериментировал с различными устройствами, но в итоге выбрал рупорный динамик. Рабочий сигнал получался от света, проходящего через звуковую дорожку фильма и обнаруживаемого светочувствительным устройством (фотоэлементом). Они использовались в системе под названием Phonofilm, которая была экспериментально опробована в ряде кинотеатров. В 1927 году кинокомпания Fox Film Corporation использовала некоторые из этих принципов при показе программы Fox Movietone News.
Тем временем в лабораториях Western Electric Company в США проводились масштабные исследования природы речи и других звуков, а также методов их записи и воспроизведения. Они экспериментировали с записью на фонографический диск и разработали 16-дюймовый (40,6 см) диск, вращающийся со скоростью 33 1/3 оборота в минуту; они усовершенствовали громкоговорители, представили тип динамика с подвижной катушкой и в целом улучшили всю электронную систему усиления. Киностудия Warner Bros. заинтересовалась всеми этими разработками и создала корпорацию Vitaphone для продажи всей системы.
Премьера Vitaphone состоялась в 1926 году, когда киностудия Warner Bros. выпустила программу с короткими музыкальными выступлениями и полнометражную картину «Дон Жуан», в которой были синхронизированы музыка и эффекты, но отсутствовала речь. В 1927 году компания выпустила фильм «Певец джаза», который по сути был немой картиной с партитурой Vitaphone и эпизодическими эпизодами синхронного пения и речи. В 1928 году Warners представила первый «стопроцентный токио», «Огни Нью-Йорка».
Хотя на этом этапе система Vitaphone обеспечивала качество звука, превосходящее системы «звук на пленке», стало ясно, что запись на пленку будет гораздо удобнее. Помимо прочих недостатков, с восковыми дисками было крайне сложно снимать на открытом воздухе или редактировать звук. К 1931 году Warner Bros. прекратила производство дисков со звуком и перешла на вариант записи звука на пленку, который предпочитали другие студии.
Звук на пленке — система, которая в разных обличьях пользовалась популярностью несколько раз, — постоянно совершенствовалась в 1910-1920-е годы. Хотя для Movietone News использовалась звуковая дорожка на негативе изображения, в драматических постановках Fox использовалась отдельная звуковая пленка на мелкозернистой печатной основе, которую можно было редактировать отдельно от изображения, но синхронно с ним. Одной из серьезных проблем систем «звук на пленке» было искажение сигнала, вносимое лампой накаливания при записи звуковой дорожки на пленку. Компания Western Electric разработала «двухструнный» световой клапан. Провод был обмотан вокруг столба и параллелен самому себе. Когда в магнитном поле на провод подавался ток, провод вибрировал в соответствии с формой электрической волны. Постоянный луч белого света, проходящий через петлю, модулировался по интенсивности изменяющимся зазором между проводами; модулированный луч фотографировался, маскируясь щелью, перпендикулярной краю пленки. В результате звуковая дорожка выглядела как более темные или более слабые параллельные линии на краю пленки. Известный как система переменной плотности, этот метод оптической записи звука первоначально использовался всеми крупными голливудскими студиями, кроме одной.
Компания Radio-Keith-Orpheum Corporation (RKO) была создана в 1928 году для демонстрации системы фотофонной записи с переменной площадью, разработанной Radio Corporation of America (RCA). В этой системе запись звука модулировалась вращающимся зеркалом, а щель была параллельна краю пленки; при воспроизведении использовалась перпендикулярная щель звуковой дорожки переменной плотности. Небольшие проблемы несовместимости записи и воспроизведения были решены в конце 1928 года, когда дорожка была сужена, чтобы оставаться в пределах области, сканируемой лучом. Для компенсации бокового смещения использовались идентичные дорожки, расположенные рядом друг с другом. Изначально уступая по качеству, система с переменной площадью постепенно сравнялась с плотной системой и полностью вытеснила ее в 1950-х годах.
В то время как скорость съемки и проецирования немых фильмов сильно различалась, звук потребовал стандартизации частоты кадров. В 1927 году скорость была стандартизирована и составила 24 кадра в секунду, или 90 футов в минуту для 35-миллиметровой пленки.
Развитие звуковых технологий в первые годы создания «говорящих картинок» было сосредоточено на двух направлениях. Одна из них включала в себя разработку камер с дирижаблем, направленных микрофонов, микрофонных штанг и более тихого освещения, чтобы звук можно было записывать более чисто во время съемки. Другие технологии были связаны с возможностью добавлять, редактировать и микшировать звук отдельно от момента записи изображения.