Każde wrażenie, otrzymane za pośrednictwem ucha (narząd Cortiego w uchu wewnętrznym), nazywamy głosem. Źródło głosu jest zawsze w obrębie kuli ziemskiej. Doświadczenia wykazują, że do wzbudzenia głosu są potrzebne nagłe, krótkie uderzenia (głos krótki). Głos ciągły powstaje , gdy liczne uderzenia powstają jedno po drugim (częstotliwość wstrząśnień powinna przekraczać 30 na sekundę – wtedy ucho nie odróżnia pojedynczych wstrząśnień). Wrażenie jednostajne i niezmienne nazywamy dźwiękiem. Wrażenia zmienne i niejednostajne nazywamy szmerami. Wrażenia głosu odbieramy dopiero po upływie niejakiego czasu, stąd wniosek, że głos bywa przewodzony; prędkość przewodzenia głosu w powietrzu równa się 340m/s, a więc równa się prędkości przewodzenia fal podłużnych w powietrzu; w ogóle prędkość przewodzenia fal w danym ośrodku równa się prędkości rozchodzenia się fal podłużnych w tymże ośrodku (w próżni głos się nie rozchodzi – dzwon pod kloszem pompy pneumatycznej nie dzwoni mimo uderzeń). Fale głosowe bywają unoszone razem z przewodnikiem (np. powietrzem), stąd prędkość ich zmienia się o prędkość przewodnika; mogą one być odbijane od powierzchni (ciała jednolite i ciecze dobrze odbijają) i wtedy otrzymujemy odgłos czyli echo. Odbicie to podlega wszystkim prawom odbicia fal.
Dźwięki posiadają następujące cechy:
1. Wysokość – mierząca się częstotliwością tj. liczbą wykonywanych drgań w ciągu sekundy
2. Natężenie – mierzące się energią drgań głosowych
3. Barwa
Wysokość można wyznaczyć za pomocą syren i wibrografów. Znamy syrenę Savarta (kółko zębate, przykładamy tekturkę), Seebecka (krążek z otworami, przez który przechodzi strumień powietrza). Oznaczając przez N liczbę obrotów krążka, przez i liczbę otworów lub zębów, przez n wysokość dźwięku otrzymamy
n = i · N
Wibrografy umożliwiają wykreślenie linii falowej, odpowiadającej danemu dźwiękowi.
Od energii głosu zależy natężenie; struna uderzona z początku wydaje dźwięk o największym natężeniu (ma dużą amplitudę), później natężenie się zmniejsza lecz pozostałe wartości pozostają bez zmian (wysokość, barwa). Doświadczenie wykazuje, że natężenie zależy od własności drgań ciała sprężystego, które przewodzi głos, od własności ciała sprężystego, które wydaje głos oraz od sposobu doprowadzania fal dźwiękowych do ucha. Od jakości drgań składowych zależy barwa dźwięku (dzięki barwie odróżniamy dwa różne instrumenty od siebie). Wrażenie dwóch równoczesnych dźwięków może być przyjemne (tony zgodne) lub nieprzyjemne (tony niezgodne). Badania wykazały, że zgodność zależy tylko od stosunku wysokości drgań – interwału (odstępu muzycznego). Najgodniejsze są tony, których stosunek wynosi 2:1, ton niższy nazywamy zasadniczym, ton wyższy jego oktawą. Mniejszą zgodność wykazują tony, których bezwzględne wysokości wyrażają się stosunkami 3/2 (kwinta), 4/3 (kwarta) 5/4 (tercja) 5/3 (seksta) 9/8 (sekunda) 15/8 (septyma). W muzyce tony literami i używamy następujących skal muzycznych „skala diatoniczna dur”, skala mol, skala „chromatyczna”. W praktyce używamy wyrównanych interwałów = 12√2 (8 tonów i 4 półtony). Najniższy ton fortepianu C2=27, najwyższy ma częstość 4096. Podstawą strojenia fortepianu jest a1 – którego częstość wynosi 435 (uchwała kongresu międzynarodowego 1885r.).
Do otrzymywania dźwięków służą również struny, pręty, błony itp. Na szczególną uwagę zasługują piszczałki, które są albo otwarte albo kryte. Zasadniczy ton piszczałki otwartej ma wysokość:
c
n = ------
2L
Gdzie L oznacza długość piszczałki a c- prędkość rozchodzenia się głosu. Wysokość zaś tonu piszczałki krytej jest dwa razy mniejsza niż piszczałki otwartej o tej samej długości. W piszczałkach stroikowych ton jest zależny od sprężystości blaszki (ludzka krtań działa jak piszczałka stroikowa).
Ciało, wydające dźwięk, może pobudzić inne ciało do drgań (za pośrednictwem jakiegoś przewodnika np.: powietrza). Zjawisko to nazywa się współbrzmieniem albo rezonacją. (Dwoje widełek nastrojonych zgodnie „unisono” ustawiamy w pobliżu siebie na pudełkach drewnianych; gdy jedne z nich pobudzimy do drgania – wtedy drugie widełki wydają ten sam ton). W instrumentach muzycznych rezonuje powietrze, zawarte w pudle (tzw. rezonansowym) – stąd odpowiednio dobrany kształt pudła np.: skrzypiec, wiolonczeli. Rezonatory Helmholtza są to specjalne kule mosiężne, dostrojone do różnych tonów, one wykazują nam, że w przeważnej liczbie dźwięków można słyszeć szereg tonów harmonicznych, od tych tonów zależy barwa dźwięku. Jeśli tony nie są harmoniczne, dźwięk przestaje być muzycznym. Rezonatory Helmholtza wykazały również, że samogłoski są dźwiękami muzycznymi; każda samogłoska składa się z innych tonów haronicznych (w zależności od rezonacji słupa powietrza zawartego w zmieniającej kształt jamie ustnej), a więc samogłoski mają różną barwę. Udało się uczonym przeprowadzić syntezę samogłosek przez odpowiedni dobór tonów i rezonatorów.
Edison (1889r.) zbudował przyrząd służący do zapisywania ludzkiej mowy, jest to fonograf, który może odtworzyć również zapisaną mowę.
Podobnie jak fale wodne, fale jak głosowe mogą się wzajemnie wzmacniać lub osłabiać. Obracając kamerton naokoło trzonka w stałym oddaleniu od ucha, można dostrzec jak oba ramiona chwilowo różnią się w fazach (dźwięk będzie przerywany) – będzie to zjawisko interferencji dwóch fal. Przyrząd Quinckego służy do wskazywania interferencji. Składa się z rury dwuramiennej z dwoma wylotami. Przy jednym trzymamy kamerton; do drugiego otworu, przy którym znajduje się ucho, dochodzi dźwięk dwoma drogami, których długość możemy odpowiednio dobierać, tak że można zupełnie stłumić ton kamertonu (gdy różnica dróg wynosi ½ długości fali). Interferencja dwóch dźwięków, różniących się nieznacznie (o kilka drgań na sekundę), sprawia tzw. dudnienie (czyli wzmacnianie i osłabianie dźwięków). Przyrząd Quinckego służy również do oznaczania szybkości głosu w różnych gazach (opieramy się na wiadomej liczbie drgań kamertonu oraz różnicy długości dróg, przy której ton milknie. Do mierzenie prędkości w gazach służy także rura Kundta. W ciałach stałych prędkość dźwięku możemy wyznaczyć za pomocą podłużnie drgających prętów.
Przy ruchu względnym ucha i źródła dźwięku, zmienia się wysokość tonu, to znaczy, iż pozornie wysokość tonu wzrasta, gdy źródło dźwięku się zbliża, a maleje, gdy się oddala. Jest to zasada Dopplera (Dźwięk trąby, umieszczonej na lokomotywie, obniża się, gy pociąg się oddala).
Energia głosu powstaje z energii mechanicznej (uderzenie dzwonu młotem), energia cieplna również zmienia się w energię głosu (huczenie w kominach, świst pary wychodzącej z kotła). Energia głosu rozprasza się we wszechświecie.