Las palabras se pronuncian por sílabas, por ejemplo:
a-ri-ga-tô go-za-i-ma-su
La e se pronuncia como nuestra e.
La u se pronuncia con la boca un poco más cerrada que nuestra u.
Las vocales con acento circunflejo son largas, es decir, duran el doble. Si establecemos una analogía con la música, diríamos que son blancas (mientras que una vocal simple sería una negra).
La r se pronuncia entre la l y la r, como una r poco marcada.
La s se pronuncia como nuestra s.
La sh se pronuncia sh.
La ch se pronuncia como nuestra ch.
La h es una consonante sorda, igual que nuestra h. No suena, como la h de hospital.